什么是 adk-eval-guide?
在运行任何 ADK 评估之前必须阅读。 ADK 评估方法 — 评估指标、评估集模式、LLM 法官、工具轨迹评分和常见失败原因。在评估代理质量、运行 adk eval 或调试 eval 结果时使用。请勿用于 API 代码模式(使用 adk-cheatsheet)、部署(使用 adk-deploy-guide)或项目脚手架(使用 adk-scaffold)。 来源:google/adk-docs。
在运行任何 ADK 评估之前必须阅读。 ADK 评估方法 — 评估指标、评估集模式、LLM 法官、工具轨迹评分和常见失败原因。在评估代理质量、运行 adk eval 或调试 eval 结果时使用。请勿用于 API 代码模式(使用 adk-cheatsheet)、部署(使用 adk-deploy-guide)或项目脚手架(使用 adk-scaffold)。
通过命令行快速安装 adk-eval-guide AI 技能到你的开发环境
来源:google/adk-docs。
Scaffolded project? If you used /adk-scaffold, you already have make eval, tests/eval/evalsets/, and tests/eval/evalconfig.json. Start with make eval and iterate from there.
Non-scaffolded? Use adk eval directly — see Running Evaluations below.
| references/criteria-guide.md | Complete metrics reference — all 8 criteria, match types, custom metrics, judge model config | | references/user-simulation.md | Dynamic conversation testing — ConversationScenario, user simulator config, compatible metrics |
在运行任何 ADK 评估之前必须阅读。 ADK 评估方法 — 评估指标、评估集模式、LLM 法官、工具轨迹评分和常见失败原因。在评估代理质量、运行 adk eval 或调试 eval 结果时使用。请勿用于 API 代码模式(使用 adk-cheatsheet)、部署(使用 adk-deploy-guide)或项目脚手架(使用 adk-scaffold)。 来源:google/adk-docs。
为搜索与 AI 引用准备的稳定字段与命令。
npx skills add https://github.com/google/adk-docs --skill adk-eval-guide在运行任何 ADK 评估之前必须阅读。 ADK 评估方法 — 评估指标、评估集模式、LLM 法官、工具轨迹评分和常见失败原因。在评估代理质量、运行 adk eval 或调试 eval 结果时使用。请勿用于 API 代码模式(使用 adk-cheatsheet)、部署(使用 adk-deploy-guide)或项目脚手架(使用 adk-scaffold)。 来源:google/adk-docs。
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/google/adk-docs --skill adk-eval-guide 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/google/adk-docs