ما هي eval-harness؟
إطار تقييم شامل للاختبار المنهجي والقياس وضمان الجودة للتطبيقات المدعومة بالذكاء الاصطناعي. يدعم تقييمات القدرات، واختبار الانحدار، وأنواع مصنفات المستويات المتعددة، والمقاييس الموحدة. المصدر: mhylle/claude-skills-collection.
إطار تقييم شامل للاختبار المنهجي والقياس وضمان الجودة للتطبيقات المدعومة بالذكاء الاصطناعي. يدعم تقييمات القدرات، واختبار الانحدار، وأنواع مصنفات المستويات المتعددة، والمقاييس الموحدة.
ثبّت مهارة الذكاء الاصطناعي eval-harness بسرعة في بيئة التطوير لديك عبر سطر الأوامر
المصدر: mhylle/claude-skills-collection.
Evaluation-driven development (EDD) is a methodology where evaluations are defined before or alongside implementation, ensuring that success criteria are explicit, measurable, and testable from the start.
Purpose: Verify that a new capability works correctly. Capability evals test whether the system can do something it couldn't do before, or does something better than before.
Purpose: Verify that existing functionality still works after changes. Regression evals protect against unintended breakage.
إطار تقييم شامل للاختبار المنهجي والقياس وضمان الجودة للتطبيقات المدعومة بالذكاء الاصطناعي. يدعم تقييمات القدرات، واختبار الانحدار، وأنواع مصنفات المستويات المتعددة، والمقاييس الموحدة. المصدر: mhylle/claude-skills-collection.
حقول وأوامر مستقرة للاقتباس في أنظمة الذكاء الاصطناعي والبحث.
npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harnessإطار تقييم شامل للاختبار المنهجي والقياس وضمان الجودة للتطبيقات المدعومة بالذكاء الاصطناعي. يدعم تقييمات القدرات، واختبار الانحدار، وأنواع مصنفات المستويات المتعددة، والمقاييس الموحدة. المصدر: mhylle/claude-skills-collection.
افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw
https://github.com/mhylle/claude-skills-collection