·eval-audit

{}

eval-audit

✓

hamelsmu/evals-skills

審查 LLM 評估流程並發現問題：缺少錯誤分析、未經驗證的判斷、虛榮指標等。在繼承評估系統、不確定評估是否值得信賴時使用，或在不存在評估基礎設施時作為起點。當目標是從頭開始建立新的評估器時，請勿使用（請改用錯誤分析、寫入判斷提示或驗證評估器）。

hamelsmu·eval·audit

81安裝·3熱度·@hamelsmu

安裝

$npx skills add https://github.com/hamelsmu/evals-skills --skill eval-audit

詳情

分類: {}資料分析
來源: skills.sh
收錄時間: 2026-03-04

相關 Skills

build-review-interface

write-judge-prompt

generate-synthetic-data

validate-evaluator