·eval-harness
</>

eval-harness

mhylle/claude-skills-collection

Cadre d'évaluation complet pour les tests systématiques, la mesure et l'assurance qualité des implémentations assistées par l'IA. Prend en charge les évaluations de capacités, les tests de régression, plusieurs types d'évaluateurs et les métriques standardisées.

2Installations·0Tendance·@mhylle

Installation

$npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness

SKILL.md

Evaluation-driven development (EDD) is a methodology where evaluations are defined before or alongside implementation, ensuring that success criteria are explicit, measurable, and testable from the start.

Purpose: Verify that a new capability works correctly. Capability evals test whether the system can do something it couldn't do before, or does something better than before.

Purpose: Verify that existing functionality still works after changes. Regression evals protect against unintended breakage.

Cadre d'évaluation complet pour les tests systématiques, la mesure et l'assurance qualité des implémentations assistées par l'IA. Prend en charge les évaluations de capacités, les tests de régression, plusieurs types d'évaluateurs et les métriques standardisées. Source : mhylle/claude-skills-collection.

Voir l'original

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness
Catégorie
</>Développement
Vérifié
Première apparition
2026-02-01
Mis à jour
2026-02-18

Réponses rapides

Qu'est-ce que eval-harness ?

Cadre d'évaluation complet pour les tests systématiques, la mesure et l'assurance qualité des implémentations assistées par l'IA. Prend en charge les évaluations de capacités, les tests de régression, plusieurs types d'évaluateurs et les métriques standardisées. Source : mhylle/claude-skills-collection.

Comment installer eval-harness ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor

Où se trouve le dépôt source ?

https://github.com/mhylle/claude-skills-collection

Détails

Catégorie
</>Développement
Source
skills.sh
Première apparition
2026-02-01