·evals
</>

evals

Напишите и проанализируйте оценки для агентов искусственного интеллекта и приложений LLM. Используйте при создании оценок, агентов тестирования, измерении качества ИИ или отладке сбоев агентов. Рекомендует EZVals в качестве предпочтительной платформы.

7Установки·0Тренд·@camronh

Установка

$npx skills add https://github.com/camronh/evals-skill --skill evals

Как установить evals

Быстро установите AI-навык evals в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/camronh/evals-skill --skill evals
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: camronh/evals-skill.

Write, run, and analyze evaluations for AI agents and LLM applications. Assume we will use EZVals as the eval framework unless you are in a non-python project or the user specifies otherwise.

Traditional ML evals measure model performance on fixed benchmarks with clear accuracy metrics. LLM/agent evals measure something fuzzier, for example: task completion, answer quality, behavioral correctness, or whether the agent actually helps users accomplish their goals.

| Target | The function or agent being evaluated. Takes input, produces output. | | Grader | Function that scores the output. Returns 0-1 or pass/fail. | | Dataset | Collection of test cases (inputs + optional expected outputs). | | Task | Single test case: one input to evaluate. | | Trial | One execution of a task. Multiple trials handle non-determinism. |

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/camronh/evals-skill --skill evals
Источник
camronh/evals-skill
Категория
</>Разработка
Проверено
Впервые замечено
2026-02-01
Обновлено
2026-03-11

Browse more skills from camronh/evals-skill

Короткие ответы

Что такое evals?

Напишите и проанализируйте оценки для агентов искусственного интеллекта и приложений LLM. Используйте при создании оценок, агентов тестирования, измерении качества ИИ или отладке сбоев агентов. Рекомендует EZVals в качестве предпочтительной платформы. Источник: camronh/evals-skill.

Как установить evals?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/camronh/evals-skill --skill evals После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/camronh/evals-skill

Детали

Категория
</>Разработка
Источник
skills.sh
Впервые замечено
2026-02-01

Похожие навыки

Нет