·slime-rl-training
{}

slime-rl-training

orchestra-research/ai-research-skills

Fournit des conseils pour la post-formation LLM avec RL en utilisant slime, un framework Megatron+SGLang. À utiliser lors de la formation de modèles GLM, de la mise en œuvre de flux de travail de génération de données personnalisés ou de la nécessité d'une intégration étroite Megatron-LM pour la mise à l'échelle RL.

15Installations·0Tendance·@orchestra-research

Installation

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training

SKILL.md

slime is an LLM post-training framework from Tsinghua's THUDM team, powering GLM-4.5, GLM-4.6, and GLM-4.7. It connects Megatron-LM for training with SGLang for high-throughput rollout generation.

Use this workflow for training reasoning models with group-relative advantages.

Use async mode for higher throughput by overlapping rollout and training.

Fournit des conseils pour la post-formation LLM avec RL en utilisant slime, un framework Megatron+SGLang. À utiliser lors de la formation de modèles GLM, de la mise en œuvre de flux de travail de génération de données personnalisés ou de la nécessité d'une intégration étroite Megatron-LM pour la mise à l'échelle RL. Source : orchestra-research/ai-research-skills.

Voir l'original

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training
Catégorie
{}Analyse de Données
Vérifié
Première apparition
2026-02-11
Mis à jour
2026-02-18

Réponses rapides

Qu'est-ce que slime-rl-training ?

Fournit des conseils pour la post-formation LLM avec RL en utilisant slime, un framework Megatron+SGLang. À utiliser lors de la formation de modèles GLM, de la mise en œuvre de flux de travail de génération de données personnalisés ou de la nécessité d'une intégration étroite Megatron-LM pour la mise à l'échelle RL. Source : orchestra-research/ai-research-skills.

Comment installer slime-rl-training ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor

Où se trouve le dépôt source ?

https://github.com/orchestra-research/ai-research-skills

Détails

Catégorie
{}Analyse de Données
Source
skills.sh
Première apparition
2026-02-11