ai-evaluation-evals

Name: ai-evaluation-evals
Author: oldwinter

✓

oldwinter/skillsGitHub: oldwinter/skills Source: oldwinter/skills

Créez des plans d’évaluation de l’IA avec des benchmarks, des rubriques et des workflows d’analyse des erreurs.

oldwinter·ai·evaluation·evals

12Installations·0Tendance·@oldwinter

Installation

GitHub: oldwinter/skills

$npx skills add https://github.com/oldwinter/skills --skill ai-evaluation-evals

Comment installer ai-evaluation-evals

Installez rapidement le skill IA ai-evaluation-evals dans votre environnement de développement via la ligne de commande

Ouvrir le Terminal: Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.)
Exécuter la commande d'installation: Copiez et exécutez cette commande : npx skills add https://github.com/oldwinter/skills --skill ai-evaluation-evals
Vérifier l'installation: Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code, Cursor ou OpenClaw

Source : oldwinter/skills.

SKILL.md

Voir l'original

Lenny Skills Database SKILLS PLAYBOOKS GUESTS ABOUT SKILLS PLAYBOOKS GUESTS ABOUT AI & Technology 2 guests | 2 insights

AI Evaluation (Evals) AI evaluation (evals) is the emerging skill of systematically testing and measuring AI model performance. As models become products, evals become the product requirements document. This involves error analysis, creating rubrics, building benchmarks, and developing systematic tests - a critical bottleneck for AI labs and a new core competency for product builders.

1 Treat evals as your product requirements In AI products, the eval suite defines what the product should do. If you can't measure it, you can't improve it. Before building features, define how you'll evaluate success. The eval is the spec - it tells the model (and your team) exactly what 'good' looks like.

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation: npx skills add https://github.com/oldwinter/skills --skill ai-evaluation-evals
Source: oldwinter/skills
Catégorie: {}Analyse de Données
Vérifié: ✓
Première apparition: 2026-02-28
Mis à jour: 2026-03-10
URL: https://www.learn-skills.dev/fr/skills/oldwinter/skills/ai-evaluation-evals

Browse more skills from oldwinter/skills

Réponses rapides

Qu'est-ce que ai-evaluation-evals ?

Créez des plans d’évaluation de l’IA avec des benchmarks, des rubriques et des workflows d’analyse des erreurs. Source : oldwinter/skills.

Comment installer ai-evaluation-evals ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/oldwinter/skills --skill ai-evaluation-evals Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code, Cursor ou OpenClaw