·validate-evaluator

{}

validate-evaluator

✓

hamelsmu/evals-skills

使用数据分割、TPR/TNR 和偏差校正根据人类标签校准 LLM 判断。当您需要在信任其输出之前验证对齐情况时，在编写判断提示（write-judge-prompt）后使用。不要用于基于代码的评估器（这些评估器是确定性的；使用标准单元测试进行测试）。

hamelsmu·validate·evaluator

74安装·3热度·@hamelsmu

安装

$npx skills add https://github.com/hamelsmu/evals-skills --skill validate-evaluator

详情

分类: {}数据分析
来源: skills.sh
收录时间: 2026-03-04

相关 Skills

build-review-interface

write-judge-prompt

generate-synthetic-data