·slime-rl-training
{}

slime-rl-training

Fornisce indicazioni per il post-formazione LLM con RL utilizzando slime, un framework Megatron+SGLang. Da utilizzare durante l'addestramento di modelli GLM, l'implementazione di flussi di lavoro di generazione dati personalizzati o la necessità di una stretta integrazione Megatron-LM per il dimensionamento RL.

39Installazioni·2Tendenza·@orchestra-research

Installazione

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training

Come installare slime-rl-training

Installa rapidamente la skill AI slime-rl-training nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: orchestra-research/ai-research-skills.

slime is an LLM post-training framework from Tsinghua's THUDM team, powering GLM-4.5, GLM-4.6, and GLM-4.7. It connects Megatron-LM for training with SGLang for high-throughput rollout generation.

Use this workflow for training reasoning models with group-relative advantages.

Use async mode for higher throughput by overlapping rollout and training.

Fornisce indicazioni per il post-formazione LLM con RL utilizzando slime, un framework Megatron+SGLang. Da utilizzare durante l'addestramento di modelli GLM, l'implementazione di flussi di lavoro di generazione dati personalizzati o la necessità di una stretta integrazione Megatron-LM per il dimensionamento RL. Fonte: orchestra-research/ai-research-skills.

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training
Categoria
{}Analisi
Verificato
Prima apparizione
2026-02-11
Aggiornato
2026-03-10

Browse more skills from orchestra-research/ai-research-skills

Risposte rapide

Che cos'è slime-rl-training?

Fornisce indicazioni per il post-formazione LLM con RL utilizzando slime, un framework Megatron+SGLang. Da utilizzare durante l'addestramento di modelli GLM, l'implementazione di flussi di lavoro di generazione dati personalizzati o la necessità di una stretta integrazione Megatron-LM per il dimensionamento RL. Fonte: orchestra-research/ai-research-skills.

Come installo slime-rl-training?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/orchestra-research/ai-research-skills