·model-evaluation-benchmark

</>

model-evaluation-benchmark

✓

rysweet/amplihack

Benchmark Suite V3に続く包括的なモデル評価ベンチマークの自動再現。モデルのベンチマーク、比較評価、または AI モデル間のパフォーマンステストのために自動で有効になります。

rysweet·model·evaluation·benchmark

26インストール·3トレンド·@rysweet

インストール

$npx skills add https://github.com/rysweet/amplihack --skill model-evaluation-benchmark

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-01

関連 Skills

cybersecurity-analyst

146 インストール

64 インストール

mermaid-diagram-generator

49 インストール

economist-analyst

47 インストール

psychologist-analyst

45 インストール

documentation-writing

44 インストール