·llm-evaluation

</>

llm-evaluation

✓

wshobson/agents

自動化されたメトリクス、人間によるフィードバック、ベンチマークを使用して、LLM アプリケーションの包括的な評価戦略を実装します。 LLM のパフォーマンスをテストする場合、AI アプリケーションの品質を測定する場合、または評価フレームワークを確立する場合に使用します。

wshobson·llm·evaluation

1.8Kインストール·62トレンド·@wshobson

インストール

$npx skills add https://github.com/wshobson/agents --skill llm-evaluation

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-01

関連 Skills

tailwind-design-system

8.0K インストール

typescript-advanced-types

6.6K インストール

api-design-principles

5.2K インストール

nodejs-backend-patterns

4.9K インストール

python-performance-optimization

4.5K インストール

architecture-patterns

4.2K インストール