Che cos'è write-judge-prompt?
Progetta valutatori LLM-as-Judge per criteri soggettivi che i controlli basati su codici non sono in grado di gestire. Utilizzare quando una modalità di fallimento richiede interpretazione (tono, fedeltà, pertinenza, completezza). NON utilizzare quando la modalità di errore può essere verificata con il codice (regex, convalida dello schema, test di esecuzione). NON utilizzare quando è necessario convalidare o calibrare il giudice: utilizzare invece validate-evaluator. Fonte: hamelsmu/evals-skills.