·ai-eval-design-and-iteration
*

ai-eval-design-and-iteration

قم بتطوير "اختبارات" (تقييمات) لقياس أداء النموذج في مهام محددة. استخدم هذه المعايير لتوجيه الضبط الدقيق وتحديد أنماط تجربة المستخدم للمنتج وتتبع تحسينات الأداء بمرور الوقت. استخدم هذا عند إطلاق ميزة الذكاء الاصطناعي الجديدة، أو التبديل بين إصدارات النماذج، أو تحسين الدقة العالية المخاطر.

4التثبيتات·0الرائج·@samarv

التثبيت

$npx skills add https://github.com/samarv/shanon --skill ai-eval-design-and-iteration

كيفية تثبيت ai-eval-design-and-iteration

ثبّت مهارة الذكاء الاصطناعي ai-eval-design-and-iteration بسرعة في بيئة التطوير لديك عبر سطر الأوامر

  1. افتح الطرفية: افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal
  2. نفّذ أمر التثبيت: انسخ ونفّذ هذا الأمر: npx skills add https://github.com/samarv/shanon --skill ai-eval-design-and-iteration
  3. تحقق من التثبيت: بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

المصدر: samarv/shanon.

In traditional software, inputs and outputs are defined. In AI, inputs and outputs are fuzzy. Evals (evaluations) are the "unit tests" for AI products. They allow you to move from "vibes-based" development to metric-driven iteration. By building a rigorous "quiz" for your model, you can determine exactly how capable your product is and where it requires human-in-the-loop scaffolding.

Identify "Hero Use Cases" Don't start with generic benchmarks (like MMLU). Instead, define the specific "hero" scenarios your product must master.

Design the "Quiz" (The Eval) Create a set of tests to gauge how well the model knows the subject material.

قم بتطوير "اختبارات" (تقييمات) لقياس أداء النموذج في مهام محددة. استخدم هذه المعايير لتوجيه الضبط الدقيق وتحديد أنماط تجربة المستخدم للمنتج وتتبع تحسينات الأداء بمرور الوقت. استخدم هذا عند إطلاق ميزة الذكاء الاصطناعي الجديدة، أو التبديل بين إصدارات النماذج، أو تحسين الدقة العالية المخاطر. المصدر: samarv/shanon.

حقائق جاهزة للاقتباس

حقول وأوامر مستقرة للاقتباس في أنظمة الذكاء الاصطناعي والبحث.

أمر التثبيت
npx skills add https://github.com/samarv/shanon --skill ai-eval-design-and-iteration
المصدر
samarv/shanon
الفئة
*وسائط إبداعية
موثق
أول ظهور
2026-02-25
آخر تحديث
2026-03-10

Browse more skills from samarv/shanon

إجابات سريعة

ما هي ai-eval-design-and-iteration؟

قم بتطوير "اختبارات" (تقييمات) لقياس أداء النموذج في مهام محددة. استخدم هذه المعايير لتوجيه الضبط الدقيق وتحديد أنماط تجربة المستخدم للمنتج وتتبع تحسينات الأداء بمرور الوقت. استخدم هذا عند إطلاق ميزة الذكاء الاصطناعي الجديدة، أو التبديل بين إصدارات النماذج، أو تحسين الدقة العالية المخاطر. المصدر: samarv/shanon.

كيف أثبّت ai-eval-design-and-iteration؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/samarv/shanon --skill ai-eval-design-and-iteration بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

أين مستودع المصدر؟

https://github.com/samarv/shanon