Was ist write-judge-prompt?
Entwerfen Sie LLM-as-Judge-Evaluatoren für subjektive Kriterien, die codebasierte Prüfungen nicht verarbeiten können. Verwenden Sie diese Option, wenn ein Fehlermodus eine Interpretation erfordert (Ton, Treue, Relevanz, Vollständigkeit). NICHT verwenden, wenn der Fehlermodus mit Code überprüft werden kann (Regex, Schemavalidierung, Ausführungstests). NICHT verwenden, wenn Sie den Richter validieren oder kalibrieren müssen – verwenden Sie stattdessen „validate-evaluator“. Quelle: hamelsmu/evals-skills.