Scaffolded project? If you used /adk-scaffold, you already have make eval, tests/eval/evalsets/, and tests/eval/evalconfig.json. Start with make eval and iterate from there.
Non-scaffolded? Use adk eval directly — see Running Evaluations below.
| references/criteria-guide.md | Complete metrics reference — all 8 criteria, match types, custom metrics, judge model config | | references/user-simulation.md | Dynamic conversation testing — ConversationScenario, user simulator config, compatible metrics |
ADK 평가를 실행하기 전에 반드시 읽어야 합니다. ADK 평가 방법론 — 평가 지표, 평가 세트 스키마, LLM-판사, 도구 궤적 채점 및 일반적인 실패 원인. 에이전트 품질을 평가하거나 adk eval을 실행하거나 평가 결과를 디버깅할 때 사용합니다. API 코드 패턴(adk-cheatsheet 사용), 배포(adk-deploy-guide 사용) 또는 프로젝트 스캐폴딩(adk-scaffold 사용)에는 사용하지 마세요. 출처: eliasecchig/adk-docs.