Qu'est-ce que write-judge-prompt ?
Concevez des évaluateurs LLM-as-Judge pour des critères subjectifs que les contrôles basés sur le code ne peuvent pas gérer. À utiliser lorsqu'un mode d'échec nécessite une interprétation (ton, fidélité, pertinence, exhaustivité). Ne PAS utiliser lorsque le mode de défaillance peut être vérifié avec du code (regex, validation de schéma, tests d'exécution). Ne PAS utiliser lorsque vous devez valider ou calibrer le juge – utilisez plutôt validate-evaluator. Source : hamelsmu/evals-skills.