miles-rl-training

Name: miles-rl-training
Author: orchestra-research

✓

本番環境に対応したスライムのフォークであるマイルを使用したエンタープライズレベルの RL トレーニングのガイダンスを提供します。 FP8/INT4 で大規模な MoE モデルをトレーニングする場合、トレーニングと推論の調整が必要な場合、またはスループットを最大化するために投機的 RL が必要な場合に使用します。

orchestra-research·miles·rl·training

15インストール·0トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-11

miles-rl-training

インストール

SKILL.md

引用可能な情報

クイックアンサー

miles-rl-training とは？

miles-rl-training のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills