training-llms-megatron

Name: training-llms-megatron
Author: ovachiever

✓

ovachiever/droid-tings

تدريب نماذج اللغات الكبيرة (معلمات 2B-462B) باستخدام NVIDIA Megatron-Core مع إستراتيجيات التوازي المتقدمة. يُستخدم عندما تحتاج نماذج التدريب > معلمات 1B إلى أقصى قدر من كفاءة وحدة معالجة الرسومات (47% MFU على H100)، أو تتطلب موتر/خط أنابيب/تسلسل/سياق/توازي خبير. إطار عمل جاهز للإنتاج يستخدم في Nemotron وLLaMA وDeepSeek.

ovachiever·training·llms·megatron

26التثبيتات·0الرائج·@ovachiever