·evals

Scrivi e analizza valutazioni per agenti AI e applicazioni LLM. Da utilizzare durante la creazione di valutazioni, il test degli agenti, la misurazione della qualità dell'intelligenza artificiale o il debug degli errori degli agenti. Raccomanda EZVals come framework preferito.

7Installazioni·1Tendenza·@camronh

Installazione

$npx skills add https://github.com/camronh/evals-skill --skill evals

Come installare evals

Installa rapidamente la skill AI evals nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/camronh/evals-skill --skill evals
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: camronh/evals-skill.

Write, run, and analyze evaluations for AI agents and LLM applications. Assume we will use EZVals as the eval framework unless you are in a non-python project or the user specifies otherwise.

Traditional ML evals measure model performance on fixed benchmarks with clear accuracy metrics. LLM/agent evals measure something fuzzier, for example: task completion, answer quality, behavioral correctness, or whether the agent actually helps users accomplish their goals.

| Target | The function or agent being evaluated. Takes input, produces output. | | Grader | Function that scores the output. Returns 0-1 or pass/fail. | | Dataset | Collection of test cases (inputs + optional expected outputs). | | Task | Single test case: one input to evaluate. | | Trial | One execution of a task. Multiple trials handle non-determinism. |

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/camronh/evals-skill --skill evals
Categoria
</>Sviluppo
Verificato
Prima apparizione
2026-02-01
Aggiornato
2026-03-10

Browse more skills from camronh/evals-skill

Risposte rapide

Che cos'è evals?

Scrivi e analizza valutazioni per agenti AI e applicazioni LLM. Da utilizzare durante la creazione di valutazioni, il test degli agenti, la misurazione della qualità dell'intelligenza artificiale o il debug degli errori degli agenti. Raccomanda EZVals come framework preferito. Fonte: camronh/evals-skill.

Come installo evals?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/camronh/evals-skill --skill evals Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/camronh/evals-skill

Dettagli

Categoria
</>Sviluppo
Fonte
skills.sh
Prima apparizione
2026-02-01

Skills correlate

Nessuna