ما هي distributed-llm-pretraining-torchtitan؟
يوفر تدريبًا مسبقًا على LLM موزعًا على PyTorch باستخدام torchtitan مع التوازي رباعي الأبعاد (FSDP2، TP، PP، CP). استخدمه عند التدريب المسبق على Llama 3.1 أو DeepSeek V3 أو النماذج المخصصة بمقياس من 8 إلى 512+ وحدة معالجة رسومات مع Float8 وtorch.compile ونقاط التفتيش الموزعة. المصدر: orchestra-research/ai-research-skills.