·eval

EvalKit は、Strands Evals SDK を使用して堅牢な評価を作成するための AI エージェント用の会話型評価フレームワークです。自然な会話を通じて、評価の計画、テストデータの生成、評価の実行、結果の分析を行うことができます。

7インストール·0トレンド·@mikeyobrien

インストール

$npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval

SKILL.md

EvalKit is a conversational evaluation framework for AI agents that guides you through creating robust evaluations using the Strands Evals SDK. Through natural conversation, you can plan evaluations, generate test data, execute evaluations, and analyze results.

EvalKit understands the evaluation workflow and guides users through four phases: Plan, Data, Eval, and Report.

User Intent: Analyze results and get recommendations Example Requests:

EvalKit は、Strands Evals SDK を使用して堅牢な評価を作成するための AI エージェント用の会話型評価フレームワークです。自然な会話を通じて、評価の計画、テストデータの生成、評価の実行、結果の分析を行うことができます。 ソース: mikeyobrien/ralph-orchestrator。

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval
カテゴリ
{}データ分析
認証済み
初回登録
2026-02-01
更新日
2026-02-18

クイックアンサー

eval とは?

EvalKit は、Strands Evals SDK を使用して堅牢な評価を作成するための AI エージェント用の会話型評価フレームワークです。自然な会話を通じて、評価の計画、テストデータの生成、評価の実行、結果の分析を行うことができます。 ソース: mikeyobrien/ralph-orchestrator。

eval のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/mikeyobrien/ralph-orchestrator