·llm-evaluation

</>

llm-evaluation

✓

wshobson/agents

使用自动化指标、人工反馈和基准测试为 LLM 申请实施全面的评估策略。在测试 LLM 表现、衡量 AI 应用程序质量或建立评估框架时使用。

wshobson·llm·evaluation

1.8K安装·62热度·@wshobson

安装

$npx skills add https://github.com/wshobson/agents --skill llm-evaluation

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-01

相关 Skills

tailwind-design-system

typescript-advanced-types

api-design-principles

nodejs-backend-patterns

python-performance-optimization

architecture-patterns