ما هي write-judge-prompt؟
قم بتصميم مقيمين LLM-as-Judge للمعايير الذاتية التي لا تستطيع عمليات التحقق القائمة على الكود التعامل معها. يُستخدم عندما يتطلب وضع الفشل تفسيرًا (النبرة، الإخلاص، الملاءمة، الاكتمال). لا تستخدمه عندما يكون من الممكن التحقق من وضع الفشل باستخدام التعليمات البرمجية (التعبير العادي، والتحقق من صحة المخطط، واختبارات التنفيذ). لا تستخدمه عندما تحتاج إلى التحقق من صحة القاضي أو معايرته - استخدم أداة التحقق من الصحة بدلاً من ذلك. المصدر: hamelsmu/evals-skills.