Что такое write-judge-prompt?
Создавайте оценщиков LLM-as-Judge с учетом субъективных критериев, с которыми не могут справиться проверки на основе кода. Используйте, когда вид отказа требует интерпретации (тон, достоверность, актуальность, полнота). НЕ используйте, если режим сбоя можно проверить с помощью кода (регулярное выражение, проверка схемы, тесты выполнения). НЕ используйте, когда вам нужно проверить или откалибровать судью — вместо этого используйте validate-evaluator. Источник: hamelsmu/evals-skills.