·validate-evaluator

{}

validate-evaluator

✓

hamelsmu/evals-skills

使用資料分割、TPR/TNR 和偏差校正根據人類標籤校準 LLM 判斷。當您需要在信任其輸出之前驗證對齊情況時，請在編寫判斷提示（write-judge-prompt）後使用。不要用於基於程式碼的評估器（這些評估器是確定性的；使用標準單元測試進行測試）。

hamelsmu·validate·evaluator

74安裝·3熱度·@hamelsmu

安裝

$npx skills add https://github.com/hamelsmu/evals-skills --skill validate-evaluator

詳情

分類: {}資料分析
來源: skills.sh
收錄時間: 2026-03-04

相關 Skills

build-review-interface

write-judge-prompt

generate-synthetic-data