slime-rl-training

Name: slime-rl-training
Author: orchestra-research

Что такое slime-rl-training?

Содержит рекомендации по пост-обучению LLM с использованием RL с использованием Slime, платформы Megatron + SGLang. Используйте при обучении моделей GLM, реализации пользовательских рабочих процессов создания данных или при необходимости тесной интеграции Megatron-LM для масштабирования RL. Источник: orchestra-research/ai-research-skills.

Как установить slime-rl-training?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/orchestra-research/ai-research-skills

Установка

Детали

Похожие навыки

slime-rl-training

Установка

Как установить slime-rl-training

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое slime-rl-training?

Как установить slime-rl-training?

Где находится исходный репозиторий?

Детали

Похожие навыки