什麼是 ai-error-analysis-and-eval-design?
透過識別特定的故障模式和建立自動化的 LLM 法官,系統化的工作流程使 AI 產品超越「氛圍檢查」。當您的 AI 輸出感覺「卡頓」、需要回饋訊號以進行快速工程或大規模監控生產性能時,請使用此功能。 來源:samarv/shanon。
透過識別特定的故障模式和建立自動化的 LLM 法官,系統化的工作流程使 AI 產品超越「氛圍檢查」。當您的 AI 輸出感覺「卡頓」、需要回饋訊號以進行快速工程或大規模監控生產性能時,請使用此功能。
透過命令列快速安裝 ai-error-analysis-and-eval-design AI 技能到你的開發環境
來源:samarv/shanon。
To build great AI products, you must transition from subjective "vibe checks" to systematic measurement. This process identifies exactly where an LLM is failing and creates a feedback loop for continuous improvement.
Phase 1: Open Coding (The "Benevolent Dictator" Phase) Before automating, you must manually ground yourself in the data. Appoint one "Benevolent Dictator"—typically the Product Manager or domain expert—to define "good" taste.
Phase 2: Axial Coding (Categorization) Synthesize your mess of notes into actionable categories using an LLM.
透過識別特定的故障模式和建立自動化的 LLM 法官,系統化的工作流程使 AI 產品超越「氛圍檢查」。當您的 AI 輸出感覺「卡頓」、需要回饋訊號以進行快速工程或大規模監控生產性能時,請使用此功能。 來源:samarv/shanon。
為搜尋與 AI 引用準備的穩定欄位與指令。
npx skills add https://github.com/samarv/shanon --skill ai-error-analysis-and-eval-design透過識別特定的故障模式和建立自動化的 LLM 法官,系統化的工作流程使 AI 產品超越「氛圍檢查」。當您的 AI 輸出感覺「卡頓」、需要回饋訊號以進行快速工程或大規模監控生產性能時,請使用此功能。 來源:samarv/shanon。
開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/samarv/shanon --skill ai-error-analysis-and-eval-design 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/samarv/shanon