·slime-user
</>

slime-user

Руководство по использованию SLIME (среда постобучения LLM для масштабирования RL). Используйте при работе с SLIME для обучения языковым моделям с подкреплением, включая настройку, конфигурацию, выполнение обучения, многоходовые взаимодействия, пользовательские модели вознаграждения, сценарии вызова инструментов или устранение неполадок в рабочих процессах SLIME. Охватывает GRPO, GSPO, PPO, Reinforce++, многоагентное RL, обучение VLM, серверные части FSDP/Megatron, интеграцию SGLang, динамическую выборку и функции пользовательской генерации.

7Установки·0Тренд·@yzlnew

Установка

$npx skills add https://github.com/yzlnew/infra-skills --skill slime-user

Как установить slime-user

Быстро установите AI-навык slime-user в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/yzlnew/infra-skills --skill slime-user
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: yzlnew/infra-skills.

SLIME is an LLM post-training framework for RL Scaling developed by THUDM. It supports various RL algorithms (GRPO, GSPO, PPO, Reinforce++), multiple training backends (Megatron, FSDP), and advanced features like multi-turn interactions, tool calling, and dynamic sampling.

SLIME has extensive documentation. Use this guide to find what you need quickly.

For detailed navigation of all documentation, see references/docnavigation.md.

Руководство по использованию SLIME (среда постобучения LLM для масштабирования RL). Используйте при работе с SLIME для обучения языковым моделям с подкреплением, включая настройку, конфигурацию, выполнение обучения, многоходовые взаимодействия, пользовательские модели вознаграждения, сценарии вызова инструментов или устранение неполадок в рабочих процессах SLIME. Охватывает GRPO, GSPO, PPO, Reinforce++, многоагентное RL, обучение VLM, серверные части FSDP/Megatron, интеграцию SGLang, динамическую выборку и функции пользовательской генерации. Источник: yzlnew/infra-skills.

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/yzlnew/infra-skills --skill slime-user
Источник
yzlnew/infra-skills
Категория
</>Разработка
Проверено
Впервые замечено
2026-02-01
Обновлено
2026-03-11

Browse more skills from yzlnew/infra-skills

Короткие ответы

Что такое slime-user?

Руководство по использованию SLIME (среда постобучения LLM для масштабирования RL). Используйте при работе с SLIME для обучения языковым моделям с подкреплением, включая настройку, конфигурацию, выполнение обучения, многоходовые взаимодействия, пользовательские модели вознаграждения, сценарии вызова инструментов или устранение неполадок в рабочих процессах SLIME. Охватывает GRPO, GSPO, PPO, Reinforce++, многоагентное RL, обучение VLM, серверные части FSDP/Megatron, интеграцию SGLang, динамическую выборку и функции пользовательской генерации. Источник: yzlnew/infra-skills.

Как установить slime-user?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/yzlnew/infra-skills --skill slime-user После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/yzlnew/infra-skills

Детали

Категория
</>Разработка
Источник
skills.sh
Впервые замечено
2026-02-01