slime-rl-training
✓Bietet Anleitungen für das LLM-Nachtraining mit RL unter Verwendung von Slime, einem Megatron+SGLang-Framework. Verwenden Sie es, wenn Sie GLM-Modelle trainieren, benutzerdefinierte Arbeitsabläufe zur Datengenerierung implementieren oder eine enge Megatron-LM-Integration für die RL-Skalierung benötigen.
Installation
SKILL.md
slime is an LLM post-training framework from Tsinghua's THUDM team, powering GLM-4.5, GLM-4.6, and GLM-4.7. It connects Megatron-LM for training with SGLang for high-throughput rollout generation.
Use this workflow for training reasoning models with group-relative advantages.
Use async mode for higher throughput by overlapping rollout and training.
Bietet Anleitungen für das LLM-Nachtraining mit RL unter Verwendung von Slime, einem Megatron+SGLang-Framework. Verwenden Sie es, wenn Sie GLM-Modelle trainieren, benutzerdefinierte Arbeitsabläufe zur Datengenerierung implementieren oder eine enge Megatron-LM-Integration für die RL-Skalierung benötigen. Quelle: orchestra-research/ai-research-skills.
Fakten (zitierbereit)
Stabile Felder und Befehle für KI/Such-Zitate.
- Installationsbefehl
npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training- Kategorie
- {}Datenanalyse
- Verifiziert
- ✓
- Erstes Auftreten
- 2026-02-11
- Aktualisiert
- 2026-02-18
Schnelle Antworten
Was ist slime-rl-training?
Bietet Anleitungen für das LLM-Nachtraining mit RL unter Verwendung von Slime, einem Megatron+SGLang-Framework. Verwenden Sie es, wenn Sie GLM-Modelle trainieren, benutzerdefinierte Arbeitsabläufe zur Datengenerierung implementieren oder eine enge Megatron-LM-Integration für die RL-Skalierung benötigen. Quelle: orchestra-research/ai-research-skills.
Wie installiere ich slime-rl-training?
Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor
Wo ist das Quell-Repository?
https://github.com/orchestra-research/ai-research-skills
Details
- Kategorie
- {}Datenanalyse
- Quelle
- skills.sh
- Erstes Auftreten
- 2026-02-11