validate-evaluator

Name: validate-evaluator
Author: hamelsmu

✓

hamelsmu/evals-skills

データ分割、TPR/TNR、バイアス補正を使用して、人間のラベルに対して LLM ジャッジを調整します。出力を信頼する前に整合性を検証する必要がある場合は、ジャッジプロンプト (write-judge-prompt) を作成した後に使用します。コードベースのエバリュエーターには使用しないでください (これらは決定論的であり、標準の単体テストでテストします)。

hamelsmu·validate·evaluator

74インストール·2トレンド·@hamelsmu

インストール

$npx skills add https://github.com/hamelsmu/evals-skills --skill validate-evaluator

詳細

カテゴリ: {}データ分析
ソース: skills.sh
初回登録: 2026-03-04

validate-evaluator

インストール

validate-evaluator のインストール方法

SKILL.md

引用可能な情報

クイックアンサー

validate-evaluator とは？

validate-evaluator のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills