·eval-harness

إطار تقييم شامل للاختبار المنهجي والقياس وضمان الجودة للتطبيقات المدعومة بالذكاء الاصطناعي. يدعم تقييمات القدرات، واختبار الانحدار، وأنواع مصنفات المستويات المتعددة، والمقاييس الموحدة.

4التثبيتات·1الرائج·@mhylle

التثبيت

$npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness

كيفية تثبيت eval-harness

ثبّت مهارة الذكاء الاصطناعي eval-harness بسرعة في بيئة التطوير لديك عبر سطر الأوامر

  1. افتح الطرفية: افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal
  2. نفّذ أمر التثبيت: انسخ ونفّذ هذا الأمر: npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness
  3. تحقق من التثبيت: بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

المصدر: mhylle/claude-skills-collection.

Evaluation-driven development (EDD) is a methodology where evaluations are defined before or alongside implementation, ensuring that success criteria are explicit, measurable, and testable from the start.

Purpose: Verify that a new capability works correctly. Capability evals test whether the system can do something it couldn't do before, or does something better than before.

Purpose: Verify that existing functionality still works after changes. Regression evals protect against unintended breakage.

إطار تقييم شامل للاختبار المنهجي والقياس وضمان الجودة للتطبيقات المدعومة بالذكاء الاصطناعي. يدعم تقييمات القدرات، واختبار الانحدار، وأنواع مصنفات المستويات المتعددة، والمقاييس الموحدة. المصدر: mhylle/claude-skills-collection.

حقائق جاهزة للاقتباس

حقول وأوامر مستقرة للاقتباس في أنظمة الذكاء الاصطناعي والبحث.

أمر التثبيت
npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness
الفئة
</>أدوات التطوير
موثق
أول ظهور
2026-02-01
آخر تحديث
2026-03-10

Browse more skills from mhylle/claude-skills-collection

إجابات سريعة

ما هي eval-harness؟

إطار تقييم شامل للاختبار المنهجي والقياس وضمان الجودة للتطبيقات المدعومة بالذكاء الاصطناعي. يدعم تقييمات القدرات، واختبار الانحدار، وأنواع مصنفات المستويات المتعددة، والمقاييس الموحدة. المصدر: mhylle/claude-skills-collection.

كيف أثبّت eval-harness؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

أين مستودع المصدر؟

https://github.com/mhylle/claude-skills-collection

التفاصيل

الفئة
</>أدوات التطوير
المصدر
skills.sh
أول ظهور
2026-02-01