eval-harness
✓Umfassender Bewertungsrahmen für systematisches Testen, Messen und Qualitätssicherung von KI-gestützten Implementierungen. Unterstützt Fähigkeitsbewertungen, Regressionstests, mehrere Grader-Typen und standardisierte Metriken.
Installation
SKILL.md
Evaluation-driven development (EDD) is a methodology where evaluations are defined before or alongside implementation, ensuring that success criteria are explicit, measurable, and testable from the start.
Purpose: Verify that a new capability works correctly. Capability evals test whether the system can do something it couldn't do before, or does something better than before.
Purpose: Verify that existing functionality still works after changes. Regression evals protect against unintended breakage.
Umfassender Bewertungsrahmen für systematisches Testen, Messen und Qualitätssicherung von KI-gestützten Implementierungen. Unterstützt Fähigkeitsbewertungen, Regressionstests, mehrere Grader-Typen und standardisierte Metriken. Quelle: mhylle/claude-skills-collection.
Fakten (zitierbereit)
Stabile Felder und Befehle für KI/Such-Zitate.
- Installationsbefehl
npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness- Kategorie
- </>Entwicklung
- Verifiziert
- ✓
- Erstes Auftreten
- 2026-02-01
- Aktualisiert
- 2026-02-18
Schnelle Antworten
Was ist eval-harness?
Umfassender Bewertungsrahmen für systematisches Testen, Messen und Qualitätssicherung von KI-gestützten Implementierungen. Unterstützt Fähigkeitsbewertungen, Regressionstests, mehrere Grader-Typen und standardisierte Metriken. Quelle: mhylle/claude-skills-collection.
Wie installiere ich eval-harness?
Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor
Wo ist das Quell-Repository?
https://github.com/mhylle/claude-skills-collection
Details
- Kategorie
- </>Entwicklung
- Quelle
- skills.sh
- Erstes Auftreten
- 2026-02-01