model-evaluation-benchmark
✓自動再現遵循Benchmark Suite V3的綜合模型評估基準。 自動激活 AI 模型之間的模型基準測試、比較評估或性能測試。
SKILL.md
Purpose: Automated reproduction of comprehensive model evaluation benchmarks following the Benchmark Suite V3 reference implementation.
Auto-activates when: User requests model benchmarking, comparison evaluation, or performance testing between AI models in agentic workflows.
This skill orchestrates end-to-end model evaluation benchmarks that measure:
自動再現遵循Benchmark Suite V3的綜合模型評估基準。 自動激活 AI 模型之間的模型基準測試、比較評估或性能測試。 來源:rysweet/amplihack。
可引用資訊
為搜尋與 AI 引用準備的穩定欄位與指令。
- 安裝指令
npx skills add https://github.com/rysweet/amplihack --skill model-evaluation-benchmark- 分類
- </>開發工具
- 認證
- ✓
- 收錄時間
- 2026-02-01
- 更新時間
- 2026-02-18
快速解答
什麼是 model-evaluation-benchmark?
自動再現遵循Benchmark Suite V3的綜合模型評估基準。 自動激活 AI 模型之間的模型基準測試、比較評估或性能測試。 來源:rysweet/amplihack。
如何安裝 model-evaluation-benchmark?
開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/rysweet/amplihack --skill model-evaluation-benchmark 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code 或 Cursor 中使用
這個 Skill 的原始碼在哪?
https://github.com/rysweet/amplihack
詳情
- 分類
- </>開發工具
- 來源
- skills.sh
- 收錄時間
- 2026-02-01