·eval-harness
</>

eval-harness

mhylle/claude-skills-collection

Umfassender Bewertungsrahmen für systematisches Testen, Messen und Qualitätssicherung von KI-gestützten Implementierungen. Unterstützt Fähigkeitsbewertungen, Regressionstests, mehrere Grader-Typen und standardisierte Metriken.

2Installationen·0Trend·@mhylle

Installation

$npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness

SKILL.md

Evaluation-driven development (EDD) is a methodology where evaluations are defined before or alongside implementation, ensuring that success criteria are explicit, measurable, and testable from the start.

Purpose: Verify that a new capability works correctly. Capability evals test whether the system can do something it couldn't do before, or does something better than before.

Purpose: Verify that existing functionality still works after changes. Regression evals protect against unintended breakage.

Umfassender Bewertungsrahmen für systematisches Testen, Messen und Qualitätssicherung von KI-gestützten Implementierungen. Unterstützt Fähigkeitsbewertungen, Regressionstests, mehrere Grader-Typen und standardisierte Metriken. Quelle: mhylle/claude-skills-collection.

Original anzeigen

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness
Kategorie
</>Entwicklung
Verifiziert
Erstes Auftreten
2026-02-01
Aktualisiert
2026-02-18

Schnelle Antworten

Was ist eval-harness?

Umfassender Bewertungsrahmen für systematisches Testen, Messen und Qualitätssicherung von KI-gestützten Implementierungen. Unterstützt Fähigkeitsbewertungen, Regressionstests, mehrere Grader-Typen und standardisierte Metriken. Quelle: mhylle/claude-skills-collection.

Wie installiere ich eval-harness?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Wo ist das Quell-Repository?

https://github.com/mhylle/claude-skills-collection