EvalKit は、Strands Evals SDK を使用して堅牢な評価を作成するための AI エージェント用の会話型評価フレームワークです。自然な会話を通じて、評価の計画、テストデータの生成、評価の実行、結果の分析を行うことができます。
SKILL.md
EvalKit is a conversational evaluation framework for AI agents that guides you through creating robust evaluations using the Strands Evals SDK. Through natural conversation, you can plan evaluations, generate test data, execute evaluations, and analyze results.
EvalKit understands the evaluation workflow and guides users through four phases: Plan, Data, Eval, and Report.
User Intent: Analyze results and get recommendations Example Requests:
EvalKit は、Strands Evals SDK を使用して堅牢な評価を作成するための AI エージェント用の会話型評価フレームワークです。自然な会話を通じて、評価の計画、テストデータの生成、評価の実行、結果の分析を行うことができます。 ソース: mikeyobrien/ralph-orchestrator。
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval- カテゴリ
- {}データ分析
- 認証済み
- ✓
- 初回登録
- 2026-02-01
- 更新日
- 2026-02-18
クイックアンサー
eval とは?
EvalKit は、Strands Evals SDK を使用して堅牢な評価を作成するための AI エージェント用の会話型評価フレームワークです。自然な会話を通じて、評価の計画、テストデータの生成、評価の実行、結果の分析を行うことができます。 ソース: mikeyobrien/ralph-orchestrator。
eval のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/mikeyobrien/ralph-orchestrator
詳細
- カテゴリ
- {}データ分析
- ソース
- skills.sh
- 初回登録
- 2026-02-01