¿Qué es write-judge-prompt?
Diseñe evaluadores de LLM como juez para criterios subjetivos que las comprobaciones basadas en códigos no pueden manejar. Úselo cuando un modo de falla requiera interpretación (tono, fidelidad, relevancia, integridad). NO lo use cuando el modo de falla se pueda verificar con código (regex, validación de esquema, pruebas de ejecución). NO lo use cuando necesite validar o calibrar al juez; en su lugar, use validar-evaluador. Fuente: hamelsmu/evals-skills.