什么是 agent-evaluation？

对 LLM 代理进行测试和基准测试，包括行为测试、能力评估、可靠性指标和生产监控，即使是顶级代理在实际基准上的成绩也低于 50% 使用场合：代理测试、代理评估、基准代理、代理可靠性、测试代理。来源：sebas-aikon-intelligence/antigravity-awesome-skills。

·agent-evaluation

</>

agent-evaluation

Name: agent-evaluation
Author: sebas-aikon-intelligence

✓

sebas-aikon-intelligence/antigravity-awesome-skills

对 LLM 代理进行测试和基准测试，包括行为测试、能力评估、可靠性指标和生产监控，即使是顶级代理在实际基准上的成绩也低于 50% 使用场合：代理测试、代理评估、基准代理、代理可靠性、测试代理。

sebas-aikon-intelligence·agent·evaluation

3安装·0热度·@sebas-aikon-intelligence

安装

$npx skills add https://github.com/sebas-aikon-intelligence/antigravity-awesome-skills --skill agent-evaluation

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-01

agent-evaluation

安装

SKILL.md

可引用信息

快速解答

什么是 agent-evaluation？

如何安装 agent-evaluation？

这个 Skill 的源码在哪？

详情

相关 Skills