·agent-evaluation
</>

agent-evaluation

Используйте при оценке производительности агента, построении рамок тестирования, измерении качества или вопросах об «оценке агента», «LLM как судья», «тестировании агента», «показателях качества», «рубриках оценки», «тестах агента».

38Установки·3Тренд·@eyadsibai

Установка

$npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation

Как установить agent-evaluation

Быстро установите AI-навык agent-evaluation в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: eyadsibai/ltk.

Agent evaluation requires different approaches than traditional software. Agents are non-deterministic, may take different valid paths, and lack single correct answers.

Research on BrowseComp found three factors explain 95% of variance:

| Token usage | 80% | More tokens = better performance | | Tool calls | 10% | More exploration helps | | Model choice | 5% | Better models multiply efficiency |

Используйте при оценке производительности агента, построении рамок тестирования, измерении качества или вопросах об «оценке агента», «LLM как судья», «тестировании агента», «показателях качества», «рубриках оценки», «тестах агента». Источник: eyadsibai/ltk.

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation
Источник
eyadsibai/ltk
Категория
</>Разработка
Проверено
Впервые замечено
2026-02-17
Обновлено
2026-03-10

Browse more skills from eyadsibai/ltk

Короткие ответы

Что такое agent-evaluation?

Используйте при оценке производительности агента, построении рамок тестирования, измерении качества или вопросах об «оценке агента», «LLM как судья», «тестировании агента», «показателях качества», «рубриках оценки», «тестах агента». Источник: eyadsibai/ltk.

Как установить agent-evaluation?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/eyadsibai/ltk --skill agent-evaluation После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/eyadsibai/ltk

Детали

Категория
</>Разработка
Источник
skills.sh
Впервые замечено
2026-02-17