moe-training

Name: moe-training
Author: orchestra-research

✓

DeepSpeed または HuggingFace を使用して、Mixture of Experts (MoE) モデルをトレーニングします。限られたコンピューティング (高密度モデルと比較して 5 倍のコスト削減) で大規模モデルをトレーニングする場合、Mixtral 8x7B や DeepSeek-V3 などのスパースアーキテクチャを実装する場合、または比例的にコンピューティングを増加させることなくモデル容量をスケーリングする場合に使用します。 MoE アーキテクチャ、ルーティングメカニズム、負荷分散、エキスパート並列処理、推論の最適化について説明します。

orchestra-research·moe·training

16インストール·1トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill moe-training

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-11

moe-training

インストール

SKILL.md

引用可能な情報

クイックアンサー

moe-training とは？

moe-training のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills