·advanced-evaluation
</>

advanced-evaluation

Овладейте методами оценки LLM в качестве судьи, включая прямое выставление оценок, парное сравнение, создание рубрик и смягчение предвзятости. Используйте при построении систем оценки, сравнении результатов моделей или установлении стандартов качества для контента, создаваемого ИИ.

60Установки·1Тренд·@shipshitdev

Установка

$npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation

Как установить advanced-evaluation

Быстро установите AI-навык advanced-evaluation в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: shipshitdev/library.

LLM-as-a-Judge techniques for evaluating AI outputs. Not a single technique but a family of approaches - choosing the right one and mitigating biases is the core competency.

Direct Scoring: Single LLM rates one response on a defined scale.

Pairwise Comparison: LLM compares two responses and selects better one.

Овладейте методами оценки LLM в качестве судьи, включая прямое выставление оценок, парное сравнение, создание рубрик и смягчение предвзятости. Используйте при построении систем оценки, сравнении результатов моделей или установлении стандартов качества для контента, создаваемого ИИ. Источник: shipshitdev/library.

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation
Источник
shipshitdev/library
Категория
</>Разработка
Проверено
Впервые замечено
2026-02-01
Обновлено
2026-03-10

Browse more skills from shipshitdev/library

Короткие ответы

Что такое advanced-evaluation?

Овладейте методами оценки LLM в качестве судьи, включая прямое выставление оценок, парное сравнение, создание рубрик и смягчение предвзятости. Используйте при построении систем оценки, сравнении результатов моделей или установлении стандартов качества для контента, создаваемого ИИ. Источник: shipshitdev/library.

Как установить advanced-evaluation?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/shipshitdev/library

Детали

Категория
</>Разработка
Источник
skills.sh
Впервые замечено
2026-02-01