slime-rl-training

Name: slime-rl-training
Author: orchestra-research

✓

Megatron + SGLang フレームワークであるスライムを使用した RL による LLM ポストトレーニングのガイダンスを提供します。 GLM モデルのトレーニング、カスタムデータ生成ワークフローの実装、または RL スケーリングのために Megatron-LM の緊密な統合が必要な場合に使用します。

orchestra-research·slime·rl·training

15インストール·0トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training

詳細

カテゴリ: {}データ分析
ソース: skills.sh
初回登録: 2026-02-11

slime-rl-training

インストール

SKILL.md

引用可能な情報

クイックアンサー

slime-rl-training とは？

slime-rl-training のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills