megatron-memory-estimator

Name: megatron-memory-estimator
Author: yzlnew

Calcule el uso de memoria de GPU para MoE (mezcla de expertos) basado en Megatron y modelos densos. Úselo cuando los usuarios necesiten (1) estimar la memoria a partir de las configuraciones del modelo HuggingFace (DeepSeek-V3, Qwen, etc.), (2) planificar la asignación de recursos de GPU para el entrenamiento, (3) comparar diferentes estrategias de paralelismo (TP/PP/EP/CP), (4) determinar si un modelo cabe en la memoria de GPU disponible u (5) optimizar las configuraciones de entrenamiento para la eficiencia de la memoria.

cached·yzlnew·megatron·memory·estimator

0Instalaciones·0Tendencia·@yzlnew