·llm-evaluation
</>

llm-evaluation

wshobson/agents

自動化されたメトリクス、人間によるフィードバック、ベンチマークを使用して、LLM アプリケーションの包括的な評価戦略を実装します。 LLM のパフォーマンスをテストする場合、AI アプリケーションの品質を測定する場合、または評価フレームワークを確立する場合に使用します。

1.8Kインストール·62トレンド·@wshobson

インストール

$npx skills add https://github.com/wshobson/agents --skill llm-evaluation

SKILL.md

Master comprehensive evaluation strategies for LLM applications, from automated metrics to human evaluation and A/B testing.

自動化されたメトリクス、人間によるフィードバック、ベンチマークを使用して、LLM アプリケーションの包括的な評価戦略を実装します。 LLM のパフォーマンスをテストする場合、AI アプリケーションの品質を測定する場合、または評価フレームワークを確立する場合に使用します。 ソース: wshobson/agents。

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/wshobson/agents --skill llm-evaluation インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

安全認証済み、信頼性の高いコード ワンクリックインストール、簡単設定 Claude Code、Cursor などに対応

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/wshobson/agents --skill llm-evaluation
カテゴリ
</>開発ツール
認証済み
初回登録
2026-02-01
更新日
2026-02-18

クイックアンサー

llm-evaluation とは?

自動化されたメトリクス、人間によるフィードバック、ベンチマークを使用して、LLM アプリケーションの包括的な評価戦略を実装します。 LLM のパフォーマンスをテストする場合、AI アプリケーションの品質を測定する場合、または評価フレームワークを確立する場合に使用します。 ソース: wshobson/agents。

llm-evaluation のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/wshobson/agents --skill llm-evaluation インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/wshobson/agents