·agent-eval-harness
</>

agent-eval-harness

plaited/agent-eval-harness

エージェントの軌跡をキャプチャするための CLI ツール。スキーマ駆動アダプターを介してヘッドレス CLI エージェントに対してプロンプトを実行し、完全な軌跡 (ツール、思考、計画) をキャプチャし、ダウンストリーム スコアリング用に構造化された JSONL を出力します。

8インストール·0トレンド·@plaited

インストール

$npx skills add https://github.com/plaited/agent-eval-harness --skill agent-eval-harness

SKILL.md

CLI tool for capturing trajectories from headless CLI agents, optimized for TypeScript/JavaScript projects using Bun.

| Prompt execution via headless adapters | Scoring logic (Braintrust, custom scripts) | | Full trajectory capture (thoughts, tools, plans) | Pass/fail determination via graders | | Structured JSONL output | LLM-as-judge prompts | | Reproducible execution environment | CI integration, golden file comparison |

Single output format: Full trajectory JSONL (always) No --format flag: Derive views with separate commands Schema exports: Zod schemas + JSON Schema for any tooling

エージェントの軌跡をキャプチャするための CLI ツール。スキーマ駆動アダプターを介してヘッドレス CLI エージェントに対してプロンプトを実行し、完全な軌跡 (ツール、思考、計画) をキャプチャし、ダウンストリーム スコアリング用に構造化された JSONL を出力します。 ソース: plaited/agent-eval-harness。

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/plaited/agent-eval-harness --skill agent-eval-harness
カテゴリ
</>開発ツール
認証済み
初回登録
2026-02-11
更新日
2026-02-18

クイックアンサー

agent-eval-harness とは?

エージェントの軌跡をキャプチャするための CLI ツール。スキーマ駆動アダプターを介してヘッドレス CLI エージェントに対してプロンプトを実行し、完全な軌跡 (ツール、思考、計画) をキャプチャし、ダウンストリーム スコアリング用に構造化された JSONL を出力します。 ソース: plaited/agent-eval-harness。

agent-eval-harness のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/plaited/agent-eval-harness --skill agent-eval-harness インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/plaited/agent-eval-harness

詳細

カテゴリ
</>開発ツール
ソース
skills.sh
初回登録
2026-02-11