write-judge-prompt とは?
コードベースのチェックでは処理できない主観的な基準に合わせて、LLM-as-Judge エバリュエーターを設計します。障害モードの解釈 (トーン、忠実度、関連性、完全性) が必要な場合に使用します。障害モードをコード (正規表現、スキーマ検証、実行テスト) で確認できる場合は使用しないでください。ジャッジを検証または調整する必要がある場合は使用しないでください。代わりに validate-evaluator を使用してください。 ソース: hamelsmu/evals-skills。