eval-harness
✓Cadre d'évaluation complet pour les tests systématiques, la mesure et l'assurance qualité des implémentations assistées par l'IA. Prend en charge les évaluations de capacités, les tests de régression, plusieurs types d'évaluateurs et les métriques standardisées.
Installation
SKILL.md
Evaluation-driven development (EDD) is a methodology where evaluations are defined before or alongside implementation, ensuring that success criteria are explicit, measurable, and testable from the start.
Purpose: Verify that a new capability works correctly. Capability evals test whether the system can do something it couldn't do before, or does something better than before.
Purpose: Verify that existing functionality still works after changes. Regression evals protect against unintended breakage.
Cadre d'évaluation complet pour les tests systématiques, la mesure et l'assurance qualité des implémentations assistées par l'IA. Prend en charge les évaluations de capacités, les tests de régression, plusieurs types d'évaluateurs et les métriques standardisées. Source : mhylle/claude-skills-collection.
Faits (prêts à citer)
Champs et commandes stables pour les citations IA/recherche.
- Commande d'installation
npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness- Catégorie
- </>Développement
- Vérifié
- ✓
- Première apparition
- 2026-02-01
- Mis à jour
- 2026-02-18
Réponses rapides
Qu'est-ce que eval-harness ?
Cadre d'évaluation complet pour les tests systématiques, la mesure et l'assurance qualité des implémentations assistées par l'IA. Prend en charge les évaluations de capacités, les tests de régression, plusieurs types d'évaluateurs et les métriques standardisées. Source : mhylle/claude-skills-collection.
Comment installer eval-harness ?
Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor
Où se trouve le dépôt source ?
https://github.com/mhylle/claude-skills-collection
Détails
- Catégorie
- </>Développement
- Source
- skills.sh
- Première apparition
- 2026-02-01