·model-evaluation-benchmark
</>

model-evaluation-benchmark

rysweet/amplihack

自动再现遵循Benchmark Suite V3的综合模型评估基准。 自动激活 AI 模型之间的模型基准测试、比较评估或性能测试。

25安装·3热度·@rysweet

安装

$npx skills add https://github.com/rysweet/amplihack --skill model-evaluation-benchmark

SKILL.md

Purpose: Automated reproduction of comprehensive model evaluation benchmarks following the Benchmark Suite V3 reference implementation.

Auto-activates when: User requests model benchmarking, comparison evaluation, or performance testing between AI models in agentic workflows.

This skill orchestrates end-to-end model evaluation benchmarks that measure:

自动再现遵循Benchmark Suite V3的综合模型评估基准。 自动激活 AI 模型之间的模型基准测试、比较评估或性能测试。 来源:rysweet/amplihack。

查看原文

可引用信息

为搜索与 AI 引用准备的稳定字段与命令。

安装命令
npx skills add https://github.com/rysweet/amplihack --skill model-evaluation-benchmark
分类
</>开发工具
认证
收录时间
2026-02-01
更新时间
2026-02-18

快速解答

什么是 model-evaluation-benchmark?

自动再现遵循Benchmark Suite V3的综合模型评估基准。 自动激活 AI 模型之间的模型基准测试、比较评估或性能测试。 来源:rysweet/amplihack。

如何安装 model-evaluation-benchmark?

打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/rysweet/amplihack --skill model-evaluation-benchmark 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code 或 Cursor 中使用

这个 Skill 的源码在哪?

https://github.com/rysweet/amplihack