·eval

EvalKit est un cadre d'évaluation conversationnelle pour les agents d'IA qui vous guide dans la création d'évaluations robustes à l'aide du SDK Strands Evals. Grâce à une conversation naturelle, vous pouvez planifier des évaluations, générer des données de test, exécuter des évaluations et analyser les résultats.

7Installations·0Tendance·@mikeyobrien

Installation

$npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval

SKILL.md

EvalKit is a conversational evaluation framework for AI agents that guides you through creating robust evaluations using the Strands Evals SDK. Through natural conversation, you can plan evaluations, generate test data, execute evaluations, and analyze results.

EvalKit understands the evaluation workflow and guides users through four phases: Plan, Data, Eval, and Report.

User Intent: Analyze results and get recommendations Example Requests:

EvalKit est un cadre d'évaluation conversationnelle pour les agents d'IA qui vous guide dans la création d'évaluations robustes à l'aide du SDK Strands Evals. Grâce à une conversation naturelle, vous pouvez planifier des évaluations, générer des données de test, exécuter des évaluations et analyser les résultats. Source : mikeyobrien/ralph-orchestrator.

Voir l'original

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval
Catégorie
{}Analyse de Données
Vérifié
Première apparition
2026-02-01
Mis à jour
2026-02-18

Réponses rapides

Qu'est-ce que eval ?

EvalKit est un cadre d'évaluation conversationnelle pour les agents d'IA qui vous guide dans la création d'évaluations robustes à l'aide du SDK Strands Evals. Grâce à une conversation naturelle, vous pouvez planifier des évaluations, générer des données de test, exécuter des évaluations et analyser les résultats. Source : mikeyobrien/ralph-orchestrator.

Comment installer eval ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor

Où se trouve le dépôt source ?

https://github.com/mikeyobrien/ralph-orchestrator