·agent-evaluation
</>

agent-evaluation

Da utilizzare quando si valutano le prestazioni dell'agente, si creano strutture di test, si misura la qualità o si chiedono informazioni su "valutazione dell'agente", "LLM-come-giudice", "test dell'agente", "metriche di qualità", "rubriche di valutazione", "benchmark dell'agente"

38Installazioni·3Tendenza·@eyadsibai

Installazione

$npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation

Come installare agent-evaluation

Installa rapidamente la skill AI agent-evaluation nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: eyadsibai/ltk.

Agent evaluation requires different approaches than traditional software. Agents are non-deterministic, may take different valid paths, and lack single correct answers.

Research on BrowseComp found three factors explain 95% of variance:

| Token usage | 80% | More tokens = better performance | | Tool calls | 10% | More exploration helps | | Model choice | 5% | Better models multiply efficiency |

Da utilizzare quando si valutano le prestazioni dell'agente, si creano strutture di test, si misura la qualità o si chiedono informazioni su "valutazione dell'agente", "LLM-come-giudice", "test dell'agente", "metriche di qualità", "rubriche di valutazione", "benchmark dell'agente" Fonte: eyadsibai/ltk.

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation
Categoria
</>Sviluppo
Verificato
Prima apparizione
2026-02-17
Aggiornato
2026-03-10

Browse more skills from eyadsibai/ltk

Risposte rapide

Che cos'è agent-evaluation?

Da utilizzare quando si valutano le prestazioni dell'agente, si creano strutture di test, si misura la qualità o si chiedono informazioni su "valutazione dell'agente", "LLM-come-giudice", "test dell'agente", "metriche di qualità", "rubriche di valutazione", "benchmark dell'agente" Fonte: eyadsibai/ltk.

Come installo agent-evaluation?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/eyadsibai/ltk