slime-rl-training
✓Megatron + SGLang フレームワークであるスライムを使用した RL による LLM ポストトレーニングのガイダンスを提供します。 GLM モデルのトレーニング、カスタム データ生成ワークフローの実装、または RL スケーリングのために Megatron-LM の緊密な統合が必要な場合に使用します。
SKILL.md
slime is an LLM post-training framework from Tsinghua's THUDM team, powering GLM-4.5, GLM-4.6, and GLM-4.7. It connects Megatron-LM for training with SGLang for high-throughput rollout generation.
Use this workflow for training reasoning models with group-relative advantages.
Use async mode for higher throughput by overlapping rollout and training.
Megatron + SGLang フレームワークであるスライムを使用した RL による LLM ポストトレーニングのガイダンスを提供します。 GLM モデルのトレーニング、カスタム データ生成ワークフローの実装、または RL スケーリングのために Megatron-LM の緊密な統合が必要な場合に使用します。 ソース: orchestra-research/ai-research-skills。
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training- カテゴリ
- {}データ分析
- 認証済み
- ✓
- 初回登録
- 2026-02-11
- 更新日
- 2026-02-18
クイックアンサー
slime-rl-training とは?
Megatron + SGLang フレームワークであるスライムを使用した RL による LLM ポストトレーニングのガイダンスを提供します。 GLM モデルのトレーニング、カスタム データ生成ワークフローの実装、または RL スケーリングのために Megatron-LM の緊密な統合が必要な場合に使用します。 ソース: orchestra-research/ai-research-skills。
slime-rl-training のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/orchestra-research/ai-research-skills
詳細
- カテゴリ
- {}データ分析
- ソース
- skills.sh
- 初回登録
- 2026-02-11