·agent-evaluation
</>

agent-evaluation

eyadsibai/ltk

エージェントのパフォーマンスの評価、テスト フレームワークの構築、品質の測定、または「エージェント評価」、「審査員としての LLM」、「エージェント テスト」、「品質指標」、「評価ルーブリック」、「エージェント ベンチマーク」について質問する場合に使用します。

28インストール·1トレンド·@eyadsibai

インストール

$npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation

SKILL.md

Agent evaluation requires different approaches than traditional software. Agents are non-deterministic, may take different valid paths, and lack single correct answers.

Research on BrowseComp found three factors explain 95% of variance:

| Token usage | 80% | More tokens = better performance | | Tool calls | 10% | More exploration helps | | Model choice | 5% | Better models multiply efficiency |

エージェントのパフォーマンスの評価、テスト フレームワークの構築、品質の測定、または「エージェント評価」、「審査員としての LLM」、「エージェント テスト」、「品質指標」、「評価ルーブリック」、「エージェント ベンチマーク」について質問する場合に使用します。 ソース: eyadsibai/ltk。

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation
ソース
eyadsibai/ltk
カテゴリ
</>開発ツール
認証済み
初回登録
2026-02-17
更新日
2026-02-18

クイックアンサー

agent-evaluation とは?

エージェントのパフォーマンスの評価、テスト フレームワークの構築、品質の測定、または「エージェント評価」、「審査員としての LLM」、「エージェント テスト」、「品質指標」、「評価ルーブリック」、「エージェント ベンチマーク」について質問する場合に使用します。 ソース: eyadsibai/ltk。

agent-evaluation のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/eyadsibai/ltk