model-evaluation-benchmark
✓Benchmark Suite V3に続く包括的なモデル評価ベンチマークの自動再現。 モデルのベンチマーク、比較評価、または AI モデル間のパフォーマンス テストのために自動で有効になります。
SKILL.md
Purpose: Automated reproduction of comprehensive model evaluation benchmarks following the Benchmark Suite V3 reference implementation.
Auto-activates when: User requests model benchmarking, comparison evaluation, or performance testing between AI models in agentic workflows.
This skill orchestrates end-to-end model evaluation benchmarks that measure:
Benchmark Suite V3に続く包括的なモデル評価ベンチマークの自動再現。 モデルのベンチマーク、比較評価、または AI モデル間のパフォーマンス テストのために自動で有効になります。 ソース: rysweet/amplihack。
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/rysweet/amplihack --skill model-evaluation-benchmark- カテゴリ
- </>開発ツール
- 認証済み
- ✓
- 初回登録
- 2026-02-01
- 更新日
- 2026-02-18
クイックアンサー
model-evaluation-benchmark とは?
Benchmark Suite V3に続く包括的なモデル評価ベンチマークの自動再現。 モデルのベンチマーク、比較評価、または AI モデル間のパフォーマンス テストのために自動で有効になります。 ソース: rysweet/amplihack。
model-evaluation-benchmark のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/rysweet/amplihack --skill model-evaluation-benchmark インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/rysweet/amplihack
詳細
- カテゴリ
- </>開発ツール
- ソース
- skills.sh
- 初回登録
- 2026-02-01