·slime-rl-training
{}

slime-rl-training

يوفر إرشادات لمرحلة ما بعد التدريب في LLM مع RL باستخدام الوحل، وهو إطار عمل Megatron+SGLang. يُستخدم عند تدريب نماذج GLM، أو تنفيذ مسارات عمل إنشاء البيانات المخصصة، أو الحاجة إلى تكامل Megatron-LM المحكم لقياس RL.

38التثبيتات·1الرائج·@orchestra-research

التثبيت

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training

كيفية تثبيت slime-rl-training

ثبّت مهارة الذكاء الاصطناعي slime-rl-training بسرعة في بيئة التطوير لديك عبر سطر الأوامر

  1. افتح الطرفية: افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal
  2. نفّذ أمر التثبيت: انسخ ونفّذ هذا الأمر: npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training
  3. تحقق من التثبيت: بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

المصدر: orchestra-research/ai-research-skills.

slime is an LLM post-training framework from Tsinghua's THUDM team, powering GLM-4.5, GLM-4.6, and GLM-4.7. It connects Megatron-LM for training with SGLang for high-throughput rollout generation.

Use this workflow for training reasoning models with group-relative advantages.

Use async mode for higher throughput by overlapping rollout and training.

يوفر إرشادات لمرحلة ما بعد التدريب في LLM مع RL باستخدام الوحل، وهو إطار عمل Megatron+SGLang. يُستخدم عند تدريب نماذج GLM، أو تنفيذ مسارات عمل إنشاء البيانات المخصصة، أو الحاجة إلى تكامل Megatron-LM المحكم لقياس RL. المصدر: orchestra-research/ai-research-skills.

حقائق جاهزة للاقتباس

حقول وأوامر مستقرة للاقتباس في أنظمة الذكاء الاصطناعي والبحث.

أمر التثبيت
npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training
الفئة
{}تحليل البيانات
موثق
أول ظهور
2026-02-11
آخر تحديث
2026-03-10

Browse more skills from orchestra-research/ai-research-skills

إجابات سريعة

ما هي slime-rl-training؟

يوفر إرشادات لمرحلة ما بعد التدريب في LLM مع RL باستخدام الوحل، وهو إطار عمل Megatron+SGLang. يُستخدم عند تدريب نماذج GLM، أو تنفيذ مسارات عمل إنشاء البيانات المخصصة، أو الحاجة إلى تكامل Megatron-LM المحكم لقياس RL. المصدر: orchestra-research/ai-research-skills.

كيف أثبّت slime-rl-training؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

أين مستودع المصدر؟

https://github.com/orchestra-research/ai-research-skills

التفاصيل

الفئة
{}تحليل البيانات
المصدر
skills.sh
أول ظهور
2026-02-11