slime-rl-training
✓Proporciona orientación para la capacitación posterior de LLM con RL usando slime, un marco Megatron+SGLang. Úselo cuando entrene modelos GLM, implemente flujos de trabajo de generación de datos personalizados o necesite una estrecha integración Megatron-LM para el escalado RL.
SKILL.md
slime is an LLM post-training framework from Tsinghua's THUDM team, powering GLM-4.5, GLM-4.6, and GLM-4.7. It connects Megatron-LM for training with SGLang for high-throughput rollout generation.
Use this workflow for training reasoning models with group-relative advantages.
Use async mode for higher throughput by overlapping rollout and training.
Proporciona orientación para la capacitación posterior de LLM con RL usando slime, un marco Megatron+SGLang. Úselo cuando entrene modelos GLM, implemente flujos de trabajo de generación de datos personalizados o necesite una estrecha integración Megatron-LM para el escalado RL. Fuente: orchestra-research/ai-research-skills.
Datos (listos para citar)
Campos y comandos estables para citas de IA/búsqueda.
- Comando de instalación
npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training- Categoría
- {}Análisis de Datos
- Verificado
- ✓
- Primera vez visto
- 2026-02-11
- Actualizado
- 2026-02-18
Respuestas rápidas
¿Qué es slime-rl-training?
Proporciona orientación para la capacitación posterior de LLM con RL usando slime, un marco Megatron+SGLang. Úselo cuando entrene modelos GLM, implemente flujos de trabajo de generación de datos personalizados o necesite una estrecha integración Megatron-LM para el escalado RL. Fuente: orchestra-research/ai-research-skills.
¿Cómo instalo slime-rl-training?
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
¿Dónde está el repositorio de origen?
https://github.com/orchestra-research/ai-research-skills
Detalles
- Categoría
- {}Análisis de Datos
- Fuente
- skills.sh
- Primera vez visto
- 2026-02-11