·eval-harness
</>

eval-harness

Quadro di valutazione completo per test sistematici, misurazione e garanzia della qualità delle implementazioni assistite dall'intelligenza artificiale. Supporta valutazioni di capacità, test di regressione, più tipi di valutatori e metriche standardizzate.

4Installazioni·1Tendenza·@mhylle

Installazione

$npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness

Come installare eval-harness

Installa rapidamente la skill AI eval-harness nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: mhylle/claude-skills-collection.

Evaluation-driven development (EDD) is a methodology where evaluations are defined before or alongside implementation, ensuring that success criteria are explicit, measurable, and testable from the start.

Purpose: Verify that a new capability works correctly. Capability evals test whether the system can do something it couldn't do before, or does something better than before.

Purpose: Verify that existing functionality still works after changes. Regression evals protect against unintended breakage.

Quadro di valutazione completo per test sistematici, misurazione e garanzia della qualità delle implementazioni assistite dall'intelligenza artificiale. Supporta valutazioni di capacità, test di regressione, più tipi di valutatori e metriche standardizzate. Fonte: mhylle/claude-skills-collection.

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness
Categoria
</>Sviluppo
Verificato
Prima apparizione
2026-02-01
Aggiornato
2026-03-10

Browse more skills from mhylle/claude-skills-collection

Risposte rapide

Che cos'è eval-harness?

Quadro di valutazione completo per test sistematici, misurazione e garanzia della qualità delle implementazioni assistite dall'intelligenza artificiale. Supporta valutazioni di capacità, test di regressione, più tipi di valutatori e metriche standardizzate. Fonte: mhylle/claude-skills-collection.

Come installo eval-harness?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/mhylle/claude-skills-collection