EvalKit 是一个用于 AI 代理的对话式评估框架,可指导您使用 Strands Evals SDK 创建可靠的评估。通过自然对话,您可以规划评估、生成测试数据、执行评估和分析结果。
SKILL.md
EvalKit is a conversational evaluation framework for AI agents that guides you through creating robust evaluations using the Strands Evals SDK. Through natural conversation, you can plan evaluations, generate test data, execute evaluations, and analyze results.
EvalKit understands the evaluation workflow and guides users through four phases: Plan, Data, Eval, and Report.
User Intent: Analyze results and get recommendations Example Requests:
EvalKit 是一个用于 AI 代理的对话式评估框架,可指导您使用 Strands Evals SDK 创建可靠的评估。通过自然对话,您可以规划评估、生成测试数据、执行评估和分析结果。 来源:mikeyobrien/ralph-orchestrator。
可引用信息
为搜索与 AI 引用准备的稳定字段与命令。
- 安装命令
npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval- 分类
- {}数据分析
- 认证
- ✓
- 收录时间
- 2026-02-01
- 更新时间
- 2026-02-18
快速解答
什么是 eval?
EvalKit 是一个用于 AI 代理的对话式评估框架,可指导您使用 Strands Evals SDK 创建可靠的评估。通过自然对话,您可以规划评估、生成测试数据、执行评估和分析结果。 来源:mikeyobrien/ralph-orchestrator。
如何安装 eval?
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code 或 Cursor 中使用
这个 Skill 的源码在哪?
https://github.com/mikeyobrien/ralph-orchestrator
详情
- 分类
- {}数据分析
- 来源
- skills.sh
- 收录时间
- 2026-02-01