·advanced-evaluation
</>

advanced-evaluation

shipshitdev/library

Maîtrisez les techniques d'évaluation LLM en tant que juge, notamment la notation directe, la comparaison par paires, la génération de rubriques et l'atténuation des biais. À utiliser lors de la création de systèmes d'évaluation, de la comparaison des résultats de modèles ou de l'établissement de normes de qualité pour le contenu généré par l'IA.

37Installations·0Tendance·@shipshitdev

Installation

$npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation

SKILL.md

LLM-as-a-Judge techniques for evaluating AI outputs. Not a single technique but a family of approaches - choosing the right one and mitigating biases is the core competency.

Direct Scoring: Single LLM rates one response on a defined scale.

Pairwise Comparison: LLM compares two responses and selects better one.

Maîtrisez les techniques d'évaluation LLM en tant que juge, notamment la notation directe, la comparaison par paires, la génération de rubriques et l'atténuation des biais. À utiliser lors de la création de systèmes d'évaluation, de la comparaison des résultats de modèles ou de l'établissement de normes de qualité pour le contenu généré par l'IA. Source : shipshitdev/library.

Voir l'original

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation
Catégorie
</>Développement
Vérifié
Première apparition
2026-02-01
Mis à jour
2026-02-18

Réponses rapides

Qu'est-ce que advanced-evaluation ?

Maîtrisez les techniques d'évaluation LLM en tant que juge, notamment la notation directe, la comparaison par paires, la génération de rubriques et l'atténuation des biais. À utiliser lors de la création de systèmes d'évaluation, de la comparaison des résultats de modèles ou de l'établissement de normes de qualité pour le contenu généré par l'IA. Source : shipshitdev/library.

Comment installer advanced-evaluation ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor

Où se trouve le dépôt source ?

https://github.com/shipshitdev/library