·eval-audit

{}

eval-audit

✓

hamelsmu/evals-skills

审核 LLM 评估流程并发现问题：缺少错误分析、未经验证的判断、虚荣指标等。在继承评估系统、不确定评估是否值得信赖时使用，或者在不存在评估基础设施时作为起点。当目标是从头开始构建新的评估器时，请勿使用（请改用错误分析、写入判断提示或验证评估器）。

hamelsmu·eval·audit

81安装·3热度·@hamelsmu

安装

$npx skills add https://github.com/hamelsmu/evals-skills --skill eval-audit

详情

分类: {}数据分析
来源: skills.sh
收录时间: 2026-03-04

相关 Skills

build-review-interface

write-judge-prompt

generate-synthetic-data

validate-evaluator