·miles-rl-training
</>

miles-rl-training

يوفر إرشادات لتدريب RL على مستوى المؤسسات باستخدام الأميال، وهي شوكة من السلايم جاهزة للإنتاج. يُستخدم عند تدريب نماذج MoE الكبيرة باستخدام FP8/INT4، أو التي تحتاج إلى محاذاة استدلال التدريب، أو تتطلب RL التخميني لتحقيق أقصى قدر من الإنتاجية.

38التثبيتات·1الرائج·@orchestra-research

التثبيت

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training

كيفية تثبيت miles-rl-training

ثبّت مهارة الذكاء الاصطناعي miles-rl-training بسرعة في بيئة التطوير لديك عبر سطر الأوامر

  1. افتح الطرفية: افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal
  2. نفّذ أمر التثبيت: انسخ ونفّذ هذا الأمر: npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training
  3. تحقق من التثبيت: بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

المصدر: orchestra-research/ai-research-skills.

miles is a high-performance, enterprise-ready RL framework optimized for large-scale model post-training. Built as a production fork of slime, it addresses critical challenges in MoE training stability, low-precision training, and train-inference alignment.

Use this workflow for training large MoE models like DeepSeek V3 or Qwen3-MoE.

Use this workflow for maximum rollout throughput with EAGLE speculative decoding.

يوفر إرشادات لتدريب RL على مستوى المؤسسات باستخدام الأميال، وهي شوكة من السلايم جاهزة للإنتاج. يُستخدم عند تدريب نماذج MoE الكبيرة باستخدام FP8/INT4، أو التي تحتاج إلى محاذاة استدلال التدريب، أو تتطلب RL التخميني لتحقيق أقصى قدر من الإنتاجية. المصدر: orchestra-research/ai-research-skills.

حقائق جاهزة للاقتباس

حقول وأوامر مستقرة للاقتباس في أنظمة الذكاء الاصطناعي والبحث.

أمر التثبيت
npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training
الفئة
</>أدوات التطوير
موثق
أول ظهور
2026-02-11
آخر تحديث
2026-03-10

Browse more skills from orchestra-research/ai-research-skills

إجابات سريعة

ما هي miles-rl-training؟

يوفر إرشادات لتدريب RL على مستوى المؤسسات باستخدام الأميال، وهي شوكة من السلايم جاهزة للإنتاج. يُستخدم عند تدريب نماذج MoE الكبيرة باستخدام FP8/INT4، أو التي تحتاج إلى محاذاة استدلال التدريب، أو تتطلب RL التخميني لتحقيق أقصى قدر من الإنتاجية. المصدر: orchestra-research/ai-research-skills.

كيف أثبّت miles-rl-training؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

أين مستودع المصدر؟

https://github.com/orchestra-research/ai-research-skills

التفاصيل

الفئة
</>أدوات التطوير
المصدر
skills.sh
أول ظهور
2026-02-11