ai-evals
✓帮助用户创建和运行人工智能评估。当有人为 LLM 产品构建评估、测量模型质量、创建测试用例、设计标准或尝试系统地测量 AI 输出质量时使用。
SKILL.md
Help the user create systematic evaluations for AI products using insights from AI practitioners.
Evals are the new PRD Brendan Foody: "If the model is the product, then the eval is the product requirement document." Evals define what success looks like in AI products—they're not optional quality checks, they're core specifications.
Evals are a core product skill Hamel Husain & Shreya Shankar: "Both the chief product officers of Anthropic and OpenAI shared that evals are becoming the most important new skill for product builders." This isn't just for ML engineers—product people need to master this.
帮助用户创建和运行人工智能评估。当有人为 LLM 产品构建评估、测量模型质量、创建测试用例、设计标准或尝试系统地测量 AI 输出质量时使用。 来源:refoundai/lenny-skills。
可引用信息
为搜索与 AI 引用准备的稳定字段与命令。
- 安装命令
npx skills add https://github.com/refoundai/lenny-skills --skill ai-evals- 分类
- </>开发工具
- 认证
- ✓
- 收录时间
- 2026-02-01
- 更新时间
- 2026-02-18
快速解答
什么是 ai-evals?
帮助用户创建和运行人工智能评估。当有人为 LLM 产品构建评估、测量模型质量、创建测试用例、设计标准或尝试系统地测量 AI 输出质量时使用。 来源:refoundai/lenny-skills。
如何安装 ai-evals?
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/refoundai/lenny-skills --skill ai-evals 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code 或 Cursor 中使用
这个 Skill 的源码在哪?
https://github.com/refoundai/lenny-skills
详情
- 分类
- </>开发工具
- 来源
- skills.sh
- 收录时间
- 2026-02-01