·slime-rl-training
{}

slime-rl-training

Содержит рекомендации по пост-обучению LLM с использованием RL с использованием Slime, платформы Megatron + SGLang. Используйте при обучении моделей GLM, реализации пользовательских рабочих процессов создания данных или при необходимости тесной интеграции Megatron-LM для масштабирования RL.

38Установки·1Тренд·@orchestra-research

Установка

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training

Как установить slime-rl-training

Быстро установите AI-навык slime-rl-training в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: orchestra-research/ai-research-skills.

slime is an LLM post-training framework from Tsinghua's THUDM team, powering GLM-4.5, GLM-4.6, and GLM-4.7. It connects Megatron-LM for training with SGLang for high-throughput rollout generation.

Use this workflow for training reasoning models with group-relative advantages.

Use async mode for higher throughput by overlapping rollout and training.

Содержит рекомендации по пост-обучению LLM с использованием RL с использованием Slime, платформы Megatron + SGLang. Используйте при обучении моделей GLM, реализации пользовательских рабочих процессов создания данных или при необходимости тесной интеграции Megatron-LM для масштабирования RL. Источник: orchestra-research/ai-research-skills.

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training
Категория
{}Аналитика
Проверено
Впервые замечено
2026-02-11
Обновлено
2026-03-10

Browse more skills from orchestra-research/ai-research-skills

Короткие ответы

Что такое slime-rl-training?

Содержит рекомендации по пост-обучению LLM с использованием RL с использованием Slime, платформы Megatron + SGLang. Используйте при обучении моделей GLM, реализации пользовательских рабочих процессов создания данных или при необходимости тесной интеграции Megatron-LM для масштабирования RL. Источник: orchestra-research/ai-research-skills.

Как установить slime-rl-training?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/orchestra-research/ai-research-skills

Детали

Категория
{}Аналитика
Источник
skills.sh
Впервые замечено
2026-02-11