agent-evaluation
✓À utiliser pour évaluer les performances des agents, créer des cadres de test, mesurer la qualité ou poser des questions sur « l'évaluation des agents », « LLM-as-juge », « tests d'agents », « métriques de qualité », « rubriques d'évaluation », « références d'agents ».
Installation
SKILL.md
Agent evaluation requires different approaches than traditional software. Agents are non-deterministic, may take different valid paths, and lack single correct answers.
Research on BrowseComp found three factors explain 95% of variance:
| Token usage | 80% | More tokens = better performance | | Tool calls | 10% | More exploration helps | | Model choice | 5% | Better models multiply efficiency |
À utiliser pour évaluer les performances des agents, créer des cadres de test, mesurer la qualité ou poser des questions sur « l'évaluation des agents », « LLM-as-juge », « tests d'agents », « métriques de qualité », « rubriques d'évaluation », « références d'agents ». Source : eyadsibai/ltk.
Faits (prêts à citer)
Champs et commandes stables pour les citations IA/recherche.
- Commande d'installation
npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation- Source
- eyadsibai/ltk
- Catégorie
- </>Développement
- Vérifié
- ✓
- Première apparition
- 2026-02-17
- Mis à jour
- 2026-02-18
Réponses rapides
Qu'est-ce que agent-evaluation ?
À utiliser pour évaluer les performances des agents, créer des cadres de test, mesurer la qualité ou poser des questions sur « l'évaluation des agents », « LLM-as-juge », « tests d'agents », « métriques de qualité », « rubriques d'évaluation », « références d'agents ». Source : eyadsibai/ltk.
Comment installer agent-evaluation ?
Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor
Où se trouve le dépôt source ?
https://github.com/eyadsibai/ltk
Détails
- Catégorie
- </>Développement
- Source
- skills.sh
- Première apparition
- 2026-02-17