·llm-evaluation

</>

llm-evaluation

microck/ordinary-claude-skills

自動化されたメトリクス、人間によるフィードバック、ベンチマークを使用して、LLM アプリケーションの包括的な評価戦略を実装します。 LLM のパフォーマンスをテストする場合、AI アプリケーションの品質を測定する場合、または評価フレームワークを確立する場合に使用します。

cached·microck·llm·evaluation

0インストール·0トレンド·@microck

インストール

$npx skills add https://github.com/microck/ordinary-claude-skills --skill llm-evaluation

詳細

カテゴリ: </>開発ツール
ソース: user
初回登録: 2026-02-01

関連 Skills

crypto-research

54 インストール

novelweave-workflow

46 インストール

moon-dev-trading-agents

30 インストール

alex-hormozi-pitch

28 インストール

21 インストール

shopify-app-dev

21 インストール