كيف أثبّت llm-as-a-judge؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/maragudk/evals-skills --skill llm-as-a-judge بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

·llm-as-a-judge

</>

llm-as-a-judge

Name: llm-as-a-judge
Author: maragudk

✓

maragudk/evals-skills

قم ببناء مقيمي LLM-as-Judge والتحقق من صحتهم ونشرهم لتقييم الجودة الآلي لمخرجات خط أنابيب LLM. استخدم هذه المهارة عندما يريد المستخدم: إنشاء مقيم آلي لأوضاع الفشل الذاتية أو الدقيقة، أو كتابة موجه حكم لتقييم النجاح/الفشل، أو تقسيم البيانات المصنفة لتطوير القاضي، أو قياس محاذاة القاضي (TPR/TNR)، أو تقدير معدلات النجاح الحقيقية مع تصحيح التحيز، أو إعداد خطوط أنابيب تقييم CI. يتم تشغيله أيضًا عندما يذكر المستخدم "مطالبة القاضي"، أو "التقييم التلقائي"، أو "مقيم LLM"، أو "مطالبة التقدير"، أو "مقاييس المحاذاة"، أو "المعدل الإيجابي الحقيقي"، أو يريد الانتقال من مراجعة التتبع اليدوية إلى التقييم الآلي. تغطي هذه المهارة دورة الحياة الكاملة: التصميم الفوري ← تقسيم البيانات ← التحسين التكراري ← تقدير معدل النجاح.

maragudk·llm·as·judge

8التثبيتات·0الرائج·@maragudk