EvalKit est un cadre d'évaluation conversationnelle pour les agents d'IA qui vous guide dans la création d'évaluations robustes à l'aide du SDK Strands Evals. Grâce à une conversation naturelle, vous pouvez planifier des évaluations, générer des données de test, exécuter des évaluations et analyser les résultats.
Installation
SKILL.md
EvalKit is a conversational evaluation framework for AI agents that guides you through creating robust evaluations using the Strands Evals SDK. Through natural conversation, you can plan evaluations, generate test data, execute evaluations, and analyze results.
EvalKit understands the evaluation workflow and guides users through four phases: Plan, Data, Eval, and Report.
User Intent: Analyze results and get recommendations Example Requests:
EvalKit est un cadre d'évaluation conversationnelle pour les agents d'IA qui vous guide dans la création d'évaluations robustes à l'aide du SDK Strands Evals. Grâce à une conversation naturelle, vous pouvez planifier des évaluations, générer des données de test, exécuter des évaluations et analyser les résultats. Source : mikeyobrien/ralph-orchestrator.
Faits (prêts à citer)
Champs et commandes stables pour les citations IA/recherche.
- Commande d'installation
npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval- Catégorie
- {}Analyse de Données
- Vérifié
- ✓
- Première apparition
- 2026-02-01
- Mis à jour
- 2026-02-18
Réponses rapides
Qu'est-ce que eval ?
EvalKit est un cadre d'évaluation conversationnelle pour les agents d'IA qui vous guide dans la création d'évaluations robustes à l'aide du SDK Strands Evals. Grâce à une conversation naturelle, vous pouvez planifier des évaluations, générer des données de test, exécuter des évaluations et analyser les résultats. Source : mikeyobrien/ralph-orchestrator.
Comment installer eval ?
Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor
Où se trouve le dépôt source ?
https://github.com/mikeyobrien/ralph-orchestrator
Détails
- Catégorie
- {}Analyse de Données
- Source
- skills.sh
- Première apparition
- 2026-02-01