miles-rl-training
✓本番環境に対応したスライムのフォークであるマイルを使用したエンタープライズ レベルの RL トレーニングのガイダンスを提供します。 FP8/INT4 で大規模な MoE モデルをトレーニングする場合、トレーニングと推論の調整が必要な場合、またはスループットを最大化するために投機的 RL が必要な場合に使用します。
SKILL.md
miles is a high-performance, enterprise-ready RL framework optimized for large-scale model post-training. Built as a production fork of slime, it addresses critical challenges in MoE training stability, low-precision training, and train-inference alignment.
Use this workflow for training large MoE models like DeepSeek V3 or Qwen3-MoE.
Use this workflow for maximum rollout throughput with EAGLE speculative decoding.
本番環境に対応したスライムのフォークであるマイルを使用したエンタープライズ レベルの RL トレーニングのガイダンスを提供します。 FP8/INT4 で大規模な MoE モデルをトレーニングする場合、トレーニングと推論の調整が必要な場合、またはスループットを最大化するために投機的 RL が必要な場合に使用します。 ソース: orchestra-research/ai-research-skills。
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training- カテゴリ
- </>開発ツール
- 認証済み
- ✓
- 初回登録
- 2026-02-11
- 更新日
- 2026-02-18
クイックアンサー
miles-rl-training とは?
本番環境に対応したスライムのフォークであるマイルを使用したエンタープライズ レベルの RL トレーニングのガイダンスを提供します。 FP8/INT4 で大規模な MoE モデルをトレーニングする場合、トレーニングと推論の調整が必要な場合、またはスループットを最大化するために投機的 RL が必要な場合に使用します。 ソース: orchestra-research/ai-research-skills。
miles-rl-training のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/orchestra-research/ai-research-skills
詳細
- カテゴリ
- </>開発ツール
- ソース
- skills.sh
- 初回登録
- 2026-02-11