·agent-evaluation
</>

agent-evaluation

eyadsibai/ltk

À utiliser pour évaluer les performances des agents, créer des cadres de test, mesurer la qualité ou poser des questions sur « l'évaluation des agents », « LLM-as-juge », « tests d'agents », « métriques de qualité », « rubriques d'évaluation », « références d'agents ».

28Installations·2Tendance·@eyadsibai

Installation

$npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation

SKILL.md

Agent evaluation requires different approaches than traditional software. Agents are non-deterministic, may take different valid paths, and lack single correct answers.

Research on BrowseComp found three factors explain 95% of variance:

| Token usage | 80% | More tokens = better performance | | Tool calls | 10% | More exploration helps | | Model choice | 5% | Better models multiply efficiency |

À utiliser pour évaluer les performances des agents, créer des cadres de test, mesurer la qualité ou poser des questions sur « l'évaluation des agents », « LLM-as-juge », « tests d'agents », « métriques de qualité », « rubriques d'évaluation », « références d'agents ». Source : eyadsibai/ltk.

Voir l'original

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation
Catégorie
</>Développement
Vérifié
Première apparition
2026-02-17
Mis à jour
2026-02-18

Réponses rapides

Qu'est-ce que agent-evaluation ?

À utiliser pour évaluer les performances des agents, créer des cadres de test, mesurer la qualité ou poser des questions sur « l'évaluation des agents », « LLM-as-juge », « tests d'agents », « métriques de qualité », « rubriques d'évaluation », « références d'agents ». Source : eyadsibai/ltk.

Comment installer agent-evaluation ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor

Où se trouve le dépôt source ?

https://github.com/eyadsibai/ltk

Détails

Catégorie
</>Développement
Source
skills.sh
Première apparition
2026-02-17