·agent-evaluation
</>

agent-evaluation

AIエージェントの包括的な評価システムを設計および実装します。コーディング エージェント、会話エージェント、調査エージェント、またはコンピュータ使用エージェントの評価を構築するときに使用します。グレーダーのタイプ、ベンチマーク、8 ステップのロードマップ、生産統合について説明します。

17インストール·0トレンド·@akillness

インストール

$npx skills add https://github.com/akillness/skills-template --skill agent-evaluation

agent-evaluation のインストール方法

コマンドラインで agent-evaluation AI スキルを開発環境にすばやくインストール

  1. ターミナルを開く: ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます
  2. インストールコマンドを実行: このコマンドをコピーして実行します: npx skills add https://github.com/akillness/skills-template --skill agent-evaluation
  3. インストールを確認: インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code、Cursor、OpenClaw で使用できるようになります

ソース: akillness/skills-template。

| Type | Turns | State | Grading | Complexity |

| Single-turn | 1 | None | Simple | Low | | Multi-turn | N | Conversation | Per-turn | Medium | | Agentic | N | World + History | Outcome | High |

| Task | Single test case (prompt + expected outcome) | | Trial | One agent run on a task | | Grader | Scoring function (code/model/human) | | Transcript | Full record of agent actions | | Outcome | Final state for grading | | Harness | Infrastructure running evals | | Suite | Collection of related tasks |

AIエージェントの包括的な評価システムを設計および実装します。コーディング エージェント、会話エージェント、調査エージェント、またはコンピュータ使用エージェントの評価を構築するときに使用します。グレーダーのタイプ、ベンチマーク、8 ステップのロードマップ、生産統合について説明します。 ソース: akillness/skills-template。

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/akillness/skills-template --skill agent-evaluation
カテゴリ
</>開発ツール
認証済み
初回登録
2026-03-09
更新日
2026-03-11

Browse more skills from akillness/skills-template

クイックアンサー

agent-evaluation とは?

AIエージェントの包括的な評価システムを設計および実装します。コーディング エージェント、会話エージェント、調査エージェント、またはコンピュータ使用エージェントの評価を構築するときに使用します。グレーダーのタイプ、ベンチマーク、8 ステップのロードマップ、生産統合について説明します。 ソース: akillness/skills-template。

agent-evaluation のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/akillness/skills-template --skill agent-evaluation インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code、Cursor、OpenClaw で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/akillness/skills-template