write-judge-prompt이란?
코드 기반 검사가 처리할 수 없는 주관적인 기준에 대한 LLM-판사 평가자를 설계합니다. 실패 모드에 해석(어조, 충실도, 관련성, 완전성)이 필요할 때 사용합니다. 코드(정규식, 스키마 유효성 검사, 실행 테스트)로 오류 모드를 확인할 수 있는 경우에는 사용하지 마세요. 심판을 검증하거나 보정해야 할 때는 사용하지 마십시오. 대신 검증 평가기를 사용하십시오. 출처: hamelsmu/evals-skills.