slime-user

Name: slime-user
Author: yzlnew

ما هي slime-user؟

دليل لاستخدام SLIME (إطار ما بعد التدريب LLM لـ RL Scaling). يُستخدم عند العمل مع SLIME لتعزيز التدريب على التعلم لنماذج اللغة، بما في ذلك الإعداد أو التكوين أو تنفيذ التدريب أو التفاعلات متعددة المنعطفات أو نماذج المكافآت المخصصة أو سيناريوهات استدعاء الأدوات أو استكشاف أخطاء سير عمل SLIME وإصلاحها. يغطي GRPO، وGSPO، وPPO، وReinforce++، وRL متعدد الوكلاء، وتدريب VLM، وواجهات FSDP/Megatron الخلفية، وتكامل SGLang، وأخذ العينات الديناميكية، ووظائف الإنشاء المخصصة. المصدر: yzlnew/infra-skills.

كيف أثبّت slime-user؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/yzlnew/infra-skills --skill slime-user بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

أين مستودع المصدر؟

https://github.com/yzlnew/infra-skills

التثبيت

التفاصيل

مهارات ذات صلة

slime-user

التثبيت

كيفية تثبيت slime-user

SKILL.md

حقائق جاهزة للاقتباس

إجابات سريعة

ما هي slime-user؟

كيف أثبّت slime-user؟

أين مستودع المصدر؟

التفاصيل

مهارات ذات صلة