megatron-memory-estimator
Megatron ベースの MoE (専門家の混合) および高密度モデルの GPU メモリ使用量を見積もります。ユーザーが (1) HuggingFace モデル構成 (DeepSeek-V3、Qwen など) からメモリを推定する、(2) トレーニング用の GPU リソース割り当てを計画する、(3) さまざまな並列処理戦略 (TP/PP/EP/CP) を比較する、(4) モデルが利用可能な GPU メモリに適合するかどうかを判断する、または (5) メモリ効率のためにトレーニング構成を最適化する必要がある場合に使用します。
SKILL.md
Estimate GPU memory usage for Megatron-based models directly from HuggingFace configs or custom specifications.
Automatically converts HuggingFace configs to Megatron format and estimates memory.
Because this tool relies on Megatron-LM components, you need to add both the tool directory and Megatron-LM to your PYTHONPATH.
Megatron ベースの MoE (専門家の混合) および高密度モデルの GPU メモリ使用量を見積もります。ユーザーが (1) HuggingFace モデル構成 (DeepSeek-V3、Qwen など) からメモリを推定する、(2) トレーニング用の GPU リソース割り当てを計画する、(3) さまざまな並列処理戦略 (TP/PP/EP/CP) を比較する、(4) モデルが利用可能な GPU メモリに適合するかどうかを判断する、または (5) メモリ効率のためにトレーニング構成を最適化する必要がある場合に使用します。 ソース: yzlnew/infra-skills。
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/yzlnew/infra-skills --skill megatron-memory-estimator- カテゴリ
- </>開発ツール
- 認証済み
- —
- 初回登録
- 2026-02-01
- 更新日
- 2026-02-18
クイックアンサー
megatron-memory-estimator とは?
Megatron ベースの MoE (専門家の混合) および高密度モデルの GPU メモリ使用量を見積もります。ユーザーが (1) HuggingFace モデル構成 (DeepSeek-V3、Qwen など) からメモリを推定する、(2) トレーニング用の GPU リソース割り当てを計画する、(3) さまざまな並列処理戦略 (TP/PP/EP/CP) を比較する、(4) モデルが利用可能な GPU メモリに適合するかどうかを判断する、または (5) メモリ効率のためにトレーニング構成を最適化する必要がある場合に使用します。 ソース: yzlnew/infra-skills。
megatron-memory-estimator のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/yzlnew/infra-skills --skill megatron-memory-estimator インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/yzlnew/infra-skills
詳細
- カテゴリ
- </>開発ツール
- ソース
- user
- 初回登録
- 2026-02-01