ما هي advanced-evaluation؟
يجب استخدام هذه المهارة عندما يطلب المستخدم "تنفيذ LLM-as-قاضي"، أو "مقارنة مخرجات النموذج"، أو "إنشاء عناوين تقييم"، أو "تخفيف تحيز التقييم"، أو يذكر التسجيل المباشر، أو المقارنة الزوجية، أو تحيز الموضع، أو خطوط أنابيب التقييم، أو تقييم الجودة الآلي. المصدر: muratcankoylan/agent-skills-for-context-engineering.