·slime-user
</>

slime-user

دليل لاستخدام SLIME (إطار ما بعد التدريب LLM لـ RL Scaling). يُستخدم عند العمل مع SLIME لتعزيز التدريب على التعلم لنماذج اللغة، بما في ذلك الإعداد أو التكوين أو تنفيذ التدريب أو التفاعلات متعددة المنعطفات أو نماذج المكافآت المخصصة أو سيناريوهات استدعاء الأدوات أو استكشاف أخطاء سير عمل SLIME وإصلاحها. يغطي GRPO، وGSPO، وPPO، وReinforce++، وRL متعدد الوكلاء، وتدريب VLM، وواجهات FSDP/Megatron الخلفية، وتكامل SGLang، وأخذ العينات الديناميكية، ووظائف الإنشاء المخصصة.

7التثبيتات·0الرائج·@yzlnew

التثبيت

$npx skills add https://github.com/yzlnew/infra-skills --skill slime-user

كيفية تثبيت slime-user

ثبّت مهارة الذكاء الاصطناعي slime-user بسرعة في بيئة التطوير لديك عبر سطر الأوامر

  1. افتح الطرفية: افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal
  2. نفّذ أمر التثبيت: انسخ ونفّذ هذا الأمر: npx skills add https://github.com/yzlnew/infra-skills --skill slime-user
  3. تحقق من التثبيت: بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

المصدر: yzlnew/infra-skills.

SLIME is an LLM post-training framework for RL Scaling developed by THUDM. It supports various RL algorithms (GRPO, GSPO, PPO, Reinforce++), multiple training backends (Megatron, FSDP), and advanced features like multi-turn interactions, tool calling, and dynamic sampling.

SLIME has extensive documentation. Use this guide to find what you need quickly.

For detailed navigation of all documentation, see references/docnavigation.md.

دليل لاستخدام SLIME (إطار ما بعد التدريب LLM لـ RL Scaling). يُستخدم عند العمل مع SLIME لتعزيز التدريب على التعلم لنماذج اللغة، بما في ذلك الإعداد أو التكوين أو تنفيذ التدريب أو التفاعلات متعددة المنعطفات أو نماذج المكافآت المخصصة أو سيناريوهات استدعاء الأدوات أو استكشاف أخطاء سير عمل SLIME وإصلاحها. يغطي GRPO، وGSPO، وPPO، وReinforce++، وRL متعدد الوكلاء، وتدريب VLM، وواجهات FSDP/Megatron الخلفية، وتكامل SGLang، وأخذ العينات الديناميكية، ووظائف الإنشاء المخصصة. المصدر: yzlnew/infra-skills.

حقائق جاهزة للاقتباس

حقول وأوامر مستقرة للاقتباس في أنظمة الذكاء الاصطناعي والبحث.

أمر التثبيت
npx skills add https://github.com/yzlnew/infra-skills --skill slime-user
الفئة
</>أدوات التطوير
موثق
أول ظهور
2026-02-01
آخر تحديث
2026-03-10

Browse more skills from yzlnew/infra-skills

إجابات سريعة

ما هي slime-user؟

دليل لاستخدام SLIME (إطار ما بعد التدريب LLM لـ RL Scaling). يُستخدم عند العمل مع SLIME لتعزيز التدريب على التعلم لنماذج اللغة، بما في ذلك الإعداد أو التكوين أو تنفيذ التدريب أو التفاعلات متعددة المنعطفات أو نماذج المكافآت المخصصة أو سيناريوهات استدعاء الأدوات أو استكشاف أخطاء سير عمل SLIME وإصلاحها. يغطي GRPO، وGSPO، وPPO، وReinforce++، وRL متعدد الوكلاء، وتدريب VLM، وواجهات FSDP/Megatron الخلفية، وتكامل SGLang، وأخذ العينات الديناميكية، ووظائف الإنشاء المخصصة. المصدر: yzlnew/infra-skills.

كيف أثبّت slime-user؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/yzlnew/infra-skills --skill slime-user بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

أين مستودع المصدر؟

https://github.com/yzlnew/infra-skills

التفاصيل

الفئة
</>أدوات التطوير
المصدر
skills.sh
أول ظهور
2026-02-01