miles-rl-training

Name: miles-rl-training
Author: orchestra-research

✓

orchestra-research/ai-research-skills

يوفر إرشادات لتدريب RL على مستوى المؤسسات باستخدام الأميال، وهي شوكة من السلايم جاهزة للإنتاج. يُستخدم عند تدريب نماذج MoE الكبيرة باستخدام FP8/INT4، أو التي تحتاج إلى محاذاة استدلال التدريب، أو تتطلب RL التخميني لتحقيق أقصى قدر من الإنتاجية.

orchestra-research·miles·rl·training

38التثبيتات·1الرائج·@orchestra-research