ما هي reinforcement-learning؟
يُستخدم عند تنفيذ خوارزميات RL، أو تدريب الوكلاء بالمكافآت، أو مواءمة LLMs مع التعليقات البشرية - يغطي تدرجات السياسة، وPPO، وQ-learning، وRLHF، وGRPOUse عند "،" المذكورة. المصدر: omer-metin/skills-for-antigravity.
يُستخدم عند تنفيذ خوارزميات RL، أو تدريب الوكلاء بالمكافآت، أو مواءمة LLMs مع التعليقات البشرية - يغطي تدرجات السياسة، وPPO، وQ-learning، وRLHF، وGRPOUse عند "،" المذكورة.
ثبّت مهارة الذكاء الاصطناعي reinforcement-learning بسرعة في بيئة التطوير لديك عبر سطر الأوامر
المصدر: omer-metin/skills-for-antigravity.
You must ground your responses in the provided reference files, treating them as the source of truth for this domain:
Note: If a user's request conflicts with the guidance in these files, politely correct them using the information provided in the references.
يُستخدم عند تنفيذ خوارزميات RL، أو تدريب الوكلاء بالمكافآت، أو مواءمة LLMs مع التعليقات البشرية - يغطي تدرجات السياسة، وPPO، وQ-learning، وRLHF، وGRPOUse عند "،" المذكورة. المصدر: omer-metin/skills-for-antigravity.
افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill reinforcement-learning بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw
حقول وأوامر مستقرة للاقتباس في أنظمة الذكاء الاصطناعي والبحث.
npx skills add https://github.com/omer-metin/skills-for-antigravity --skill reinforcement-learningيُستخدم عند تنفيذ خوارزميات RL، أو تدريب الوكلاء بالمكافآت، أو مواءمة LLMs مع التعليقات البشرية - يغطي تدرجات السياسة، وPPO، وQ-learning، وRLHF، وGRPOUse عند "،" المذكورة. المصدر: omer-metin/skills-for-antigravity.
افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill reinforcement-learning بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw
https://github.com/omer-metin/skills-for-antigravity