·slime-rl-training
{}

slime-rl-training

orchestra-research/ai-research-skills

Bietet Anleitungen für das LLM-Nachtraining mit RL unter Verwendung von Slime, einem Megatron+SGLang-Framework. Verwenden Sie es, wenn Sie GLM-Modelle trainieren, benutzerdefinierte Arbeitsabläufe zur Datengenerierung implementieren oder eine enge Megatron-LM-Integration für die RL-Skalierung benötigen.

16Installationen·1Trend·@orchestra-research

Installation

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training

SKILL.md

slime is an LLM post-training framework from Tsinghua's THUDM team, powering GLM-4.5, GLM-4.6, and GLM-4.7. It connects Megatron-LM for training with SGLang for high-throughput rollout generation.

Use this workflow for training reasoning models with group-relative advantages.

Use async mode for higher throughput by overlapping rollout and training.

Bietet Anleitungen für das LLM-Nachtraining mit RL unter Verwendung von Slime, einem Megatron+SGLang-Framework. Verwenden Sie es, wenn Sie GLM-Modelle trainieren, benutzerdefinierte Arbeitsabläufe zur Datengenerierung implementieren oder eine enge Megatron-LM-Integration für die RL-Skalierung benötigen. Quelle: orchestra-research/ai-research-skills.

Original anzeigen

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training
Kategorie
{}Datenanalyse
Verifiziert
Erstes Auftreten
2026-02-11
Aktualisiert
2026-02-18

Schnelle Antworten

Was ist slime-rl-training?

Bietet Anleitungen für das LLM-Nachtraining mit RL unter Verwendung von Slime, einem Megatron+SGLang-Framework. Verwenden Sie es, wenn Sie GLM-Modelle trainieren, benutzerdefinierte Arbeitsabläufe zur Datengenerierung implementieren oder eine enge Megatron-LM-Integration für die RL-Skalierung benötigen. Quelle: orchestra-research/ai-research-skills.

Wie installiere ich slime-rl-training?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Wo ist das Quell-Repository?

https://github.com/orchestra-research/ai-research-skills