·moe-training
</>

moe-training

orchestra-research/ai-research-skills

DeepSpeed または HuggingFace を使用して、Mixture of Experts (MoE) モデルをトレーニングします。限られたコンピューティング (高密度モデルと比較して 5 倍のコスト削減) で大規模モデルをトレーニングする場合、Mixtral 8x7B や DeepSeek-V3 などのスパース アーキテクチャを実装する場合、または比例的にコンピューティングを増加させることなくモデル容量をスケーリングする場合に使用します。 MoE アーキテクチャ、ルーティング メカニズム、負荷分散、エキスパート並列処理、推論の最適化について説明します。

16インストール·1トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill moe-training

SKILL.md

Notable MoE Models: Mixtral 8x7B (Mistral AI), DeepSeek-V3, Switch Transformers (Google), GLaM (Google), NLLB-MoE (Meta)

DeepSpeed または HuggingFace を使用して、Mixture of Experts (MoE) モデルをトレーニングします。限られたコンピューティング (高密度モデルと比較して 5 倍のコスト削減) で大規模モデルをトレーニングする場合、Mixtral 8x7B や DeepSeek-V3 などのスパース アーキテクチャを実装する場合、または比例的にコンピューティングを増加させることなくモデル容量をスケーリングする場合に使用します。 MoE アーキテクチャ、ルーティング メカニズム、負荷分散、エキスパート並列処理、推論の最適化について説明します。 ソース: orchestra-research/ai-research-skills。

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/orchestra-research/ai-research-skills --skill moe-training インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

安全認証済み、信頼性の高いコード ワンクリックインストール、簡単設定 Claude Code、Cursor などに対応

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/orchestra-research/ai-research-skills --skill moe-training
カテゴリ
</>開発ツール
認証済み
初回登録
2026-02-11
更新日
2026-02-18

クイックアンサー

moe-training とは?

DeepSpeed または HuggingFace を使用して、Mixture of Experts (MoE) モデルをトレーニングします。限られたコンピューティング (高密度モデルと比較して 5 倍のコスト削減) で大規模モデルをトレーニングする場合、Mixtral 8x7B や DeepSeek-V3 などのスパース アーキテクチャを実装する場合、または比例的にコンピューティングを増加させることなくモデル容量をスケーリングする場合に使用します。 MoE アーキテクチャ、ルーティング メカニズム、負荷分散、エキスパート並列処理、推論の最適化について説明します。 ソース: orchestra-research/ai-research-skills。

moe-training のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/orchestra-research/ai-research-skills --skill moe-training インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/orchestra-research/ai-research-skills