什么是 error-analysis?
通过读取跟踪记录,帮助用户系统地识别 LLM 管道中的故障模式并对其进行分类。在启动新的评估项目、重大管道更改(新功能、模型切换、提示重写)后、生产指标下降时或发生事件后使用。 来源:hamelsmu/evals-skills。
通过读取跟踪记录,帮助用户系统地识别 LLM 管道中的故障模式并对其进行分类。在启动新的评估项目、重大管道更改(新功能、模型切换、提示重写)后、生产指标下降时或发生事件后使用。
通过命令行快速安装 error-analysis AI 技能到你的开发环境
来源:hamelsmu/evals-skills。
Guide the user through reading LLM pipeline traces and building a catalog of how the system fails.
Capture the full trace: input, all intermediate LLM calls, tool uses, retrieved documents, reasoning steps, and final output.
Target: 100 traces. This is roughly where new traces stop revealing new kinds of failures. The number depends on system complexity.
通过读取跟踪记录,帮助用户系统地识别 LLM 管道中的故障模式并对其进行分类。在启动新的评估项目、重大管道更改(新功能、模型切换、提示重写)后、生产指标下降时或发生事件后使用。 来源:hamelsmu/evals-skills。
为搜索与 AI 引用准备的稳定字段与命令。
npx skills add https://github.com/hamelsmu/evals-skills --skill error-analysis通过读取跟踪记录,帮助用户系统地识别 LLM 管道中的故障模式并对其进行分类。在启动新的评估项目、重大管道更改(新功能、模型切换、提示重写)后、生产指标下降时或发生事件后使用。 来源:hamelsmu/evals-skills。
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/hamelsmu/evals-skills --skill error-analysis 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/hamelsmu/evals-skills