advanced-evaluation
✓Maîtrisez les techniques d'évaluation LLM en tant que juge, notamment la notation directe, la comparaison par paires, la génération de rubriques et l'atténuation des biais. À utiliser lors de la création de systèmes d'évaluation, de la comparaison des résultats de modèles ou de l'établissement de normes de qualité pour le contenu généré par l'IA.
Installation
SKILL.md
LLM-as-a-Judge techniques for evaluating AI outputs. Not a single technique but a family of approaches - choosing the right one and mitigating biases is the core competency.
Direct Scoring: Single LLM rates one response on a defined scale.
Pairwise Comparison: LLM compares two responses and selects better one.
Maîtrisez les techniques d'évaluation LLM en tant que juge, notamment la notation directe, la comparaison par paires, la génération de rubriques et l'atténuation des biais. À utiliser lors de la création de systèmes d'évaluation, de la comparaison des résultats de modèles ou de l'établissement de normes de qualité pour le contenu généré par l'IA. Source : shipshitdev/library.
Faits (prêts à citer)
Champs et commandes stables pour les citations IA/recherche.
- Commande d'installation
npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation- Source
- shipshitdev/library
- Catégorie
- </>Développement
- Vérifié
- ✓
- Première apparition
- 2026-02-01
- Mis à jour
- 2026-02-18
Réponses rapides
Qu'est-ce que advanced-evaluation ?
Maîtrisez les techniques d'évaluation LLM en tant que juge, notamment la notation directe, la comparaison par paires, la génération de rubriques et l'atténuation des biais. À utiliser lors de la création de systèmes d'évaluation, de la comparaison des résultats de modèles ou de l'établissement de normes de qualité pour le contenu généré par l'IA. Source : shipshitdev/library.
Comment installer advanced-evaluation ?
Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor
Où se trouve le dépôt source ?
https://github.com/shipshitdev/library
Détails
- Catégorie
- </>Développement
- Source
- skills.sh
- Première apparition
- 2026-02-01