什么是 ai-error-analysis-and-eval-design?
通过识别特定的故障模式和构建自动化的 LLM 法官,系统化的工作流程使 AI 产品超越“氛围检查”。当您的 AI 输出感觉“卡顿”、需要反馈信号以进行快速工程或大规模监控生产性能时,请使用此功能。 来源:samarv/shanon。
通过识别特定的故障模式和构建自动化的 LLM 法官,系统化的工作流程使 AI 产品超越“氛围检查”。当您的 AI 输出感觉“卡顿”、需要反馈信号以进行快速工程或大规模监控生产性能时,请使用此功能。
通过命令行快速安装 ai-error-analysis-and-eval-design AI 技能到你的开发环境
来源:samarv/shanon。
To build great AI products, you must transition from subjective "vibe checks" to systematic measurement. This process identifies exactly where an LLM is failing and creates a feedback loop for continuous improvement.
Phase 1: Open Coding (The "Benevolent Dictator" Phase) Before automating, you must manually ground yourself in the data. Appoint one "Benevolent Dictator"—typically the Product Manager or domain expert—to define "good" taste.
Phase 2: Axial Coding (Categorization) Synthesize your mess of notes into actionable categories using an LLM.
通过识别特定的故障模式和构建自动化的 LLM 法官,系统化的工作流程使 AI 产品超越“氛围检查”。当您的 AI 输出感觉“卡顿”、需要反馈信号以进行快速工程或大规模监控生产性能时,请使用此功能。 来源:samarv/shanon。
为搜索与 AI 引用准备的稳定字段与命令。
npx skills add https://github.com/samarv/shanon --skill ai-error-analysis-and-eval-design通过识别特定的故障模式和构建自动化的 LLM 法官,系统化的工作流程使 AI 产品超越“氛围检查”。当您的 AI 输出感觉“卡顿”、需要反馈信号以进行快速工程或大规模监控生产性能时,请使用此功能。 来源:samarv/shanon。
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/samarv/shanon --skill ai-error-analysis-and-eval-design 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/samarv/shanon