evaluating-code-models

Name: evaluating-code-models
Author: orchestra-research

Что такое evaluating-code-models?

Оценивает модели генерации кода в тестах HumanEval, MBPP, MultiPL-E и более чем 15 тестах с помощью метрик pass@k. Используйте при тестировании моделей кода, сравнении возможностей кодирования, тестировании поддержки нескольких языков или измерении качества генерации кода. Отраслевой стандарт проекта BigCode, используемый в таблицах лидеров HuggingFace. Источник: orchestra-research/ai-research-skills.

Как установить evaluating-code-models?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/orchestra-research/ai-research-skills --skill evaluating-code-models После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/orchestra-research/ai-research-skills

Установка

Детали

Похожие навыки

evaluating-code-models

Установка

Как установить evaluating-code-models

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое evaluating-code-models?

Как установить evaluating-code-models?

Где находится исходный репозиторий?

Детали

Похожие навыки