·advanced-evaluation

</>

advanced-evaluation

✓

guanyang/antigravity-skills

このスキルは、ユーザーが「LLM-as-judge の実装」、「モデル出力の比較」、「評価ルーブリックの作成」、「評価バイアスの軽減」を要求する場合、または直接スコアリング、ペアごとの比較、位置バイアス、評価パイプライン、または自動品質評価に言及する場合に使用する必要があります。

guanyang·advanced·evaluation

17インストール·2トレンド·@guanyang

インストール

$npx skills add https://github.com/guanyang/antigravity-skills --skill advanced-evaluation

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-01

関連 Skills

filesystem-context

32 インストール

32 インストール

frontend-design

25 インストール

planning-with-files

21 インストール

obsidian-markdown

20 インストール

systematic-debugging

20 インストール