slime-rl-training
✓Fournit des conseils pour la post-formation LLM avec RL en utilisant slime, un framework Megatron+SGLang. À utiliser lors de la formation de modèles GLM, de la mise en œuvre de flux de travail de génération de données personnalisés ou de la nécessité d'une intégration étroite Megatron-LM pour la mise à l'échelle RL.
Installation
SKILL.md
slime is an LLM post-training framework from Tsinghua's THUDM team, powering GLM-4.5, GLM-4.6, and GLM-4.7. It connects Megatron-LM for training with SGLang for high-throughput rollout generation.
Use this workflow for training reasoning models with group-relative advantages.
Use async mode for higher throughput by overlapping rollout and training.
Fournit des conseils pour la post-formation LLM avec RL en utilisant slime, un framework Megatron+SGLang. À utiliser lors de la formation de modèles GLM, de la mise en œuvre de flux de travail de génération de données personnalisés ou de la nécessité d'une intégration étroite Megatron-LM pour la mise à l'échelle RL. Source : orchestra-research/ai-research-skills.
Faits (prêts à citer)
Champs et commandes stables pour les citations IA/recherche.
- Commande d'installation
npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training- Catégorie
- {}Analyse de Données
- Vérifié
- ✓
- Première apparition
- 2026-02-11
- Mis à jour
- 2026-02-18
Réponses rapides
Qu'est-ce que slime-rl-training ?
Fournit des conseils pour la post-formation LLM avec RL en utilisant slime, un framework Megatron+SGLang. À utiliser lors de la formation de modèles GLM, de la mise en œuvre de flux de travail de génération de données personnalisés ou de la nécessité d'une intégration étroite Megatron-LM pour la mise à l'échelle RL. Source : orchestra-research/ai-research-skills.
Comment installer slime-rl-training ?
Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor
Où se trouve le dépôt source ?
https://github.com/orchestra-research/ai-research-skills
Détails
- Catégorie
- {}Analyse de Données
- Source
- skills.sh
- Première apparition
- 2026-02-11