·stable-baselines3
</>

stable-baselines3

استخدم هذه المهارة لمهام التعلم المعزز بما في ذلك تدريب وكلاء RL (PPO، وSAC، وDQN، وTD3، وDDPG، وA2C، وما إلى ذلك)، وإنشاء بيئات رياضية مخصصة، وتنفيذ عمليات الاسترجاعات للمراقبة والتحكم، واستخدام البيئات الموجهة للتدريب المتوازي، والتكامل مع سير عمل RL العميق. يجب استخدام هذه المهارة عندما يطلب المستخدمون تنفيذ خوارزمية RL، أو تدريب الوكيل، أو تصميم البيئة، أو تجربة RL.

27التثبيتات·0الرائج·@ovachiever

التثبيت

$npx skills add https://github.com/ovachiever/droid-tings --skill stable-baselines3

كيفية تثبيت stable-baselines3

ثبّت مهارة الذكاء الاصطناعي stable-baselines3 بسرعة في بيئة التطوير لديك عبر سطر الأوامر

  1. افتح الطرفية: افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal
  2. نفّذ أمر التثبيت: انسخ ونفّذ هذا الأمر: npx skills add https://github.com/ovachiever/droid-tings --skill stable-baselines3
  3. تحقق من التثبيت: بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

المصدر: ovachiever/droid-tings.

Stable Baselines3 (SB3) is a PyTorch-based library providing reliable implementations of reinforcement learning algorithms. This skill provides comprehensive guidance for training RL agents, creating custom environments, implementing callbacks, and optimizing training workflows using SB3's unified API.

Algorithm Selection: Use references/algorithms.md for detailed algorithm characteristics and selection guidance. Quick reference:

See scripts/trainrlagent.py for a complete training template with best practices.

استخدم هذه المهارة لمهام التعلم المعزز بما في ذلك تدريب وكلاء RL (PPO، وSAC، وDQN، وTD3، وDDPG، وA2C، وما إلى ذلك)، وإنشاء بيئات رياضية مخصصة، وتنفيذ عمليات الاسترجاعات للمراقبة والتحكم، واستخدام البيئات الموجهة للتدريب المتوازي، والتكامل مع سير عمل RL العميق. يجب استخدام هذه المهارة عندما يطلب المستخدمون تنفيذ خوارزمية RL، أو تدريب الوكيل، أو تصميم البيئة، أو تجربة RL. المصدر: ovachiever/droid-tings.

حقائق جاهزة للاقتباس

حقول وأوامر مستقرة للاقتباس في أنظمة الذكاء الاصطناعي والبحث.

أمر التثبيت
npx skills add https://github.com/ovachiever/droid-tings --skill stable-baselines3
الفئة
</>أدوات التطوير
موثق
أول ظهور
2026-02-01
آخر تحديث
2026-03-11

Browse more skills from ovachiever/droid-tings

إجابات سريعة

ما هي stable-baselines3؟

استخدم هذه المهارة لمهام التعلم المعزز بما في ذلك تدريب وكلاء RL (PPO، وSAC، وDQN، وTD3، وDDPG، وA2C، وما إلى ذلك)، وإنشاء بيئات رياضية مخصصة، وتنفيذ عمليات الاسترجاعات للمراقبة والتحكم، واستخدام البيئات الموجهة للتدريب المتوازي، والتكامل مع سير عمل RL العميق. يجب استخدام هذه المهارة عندما يطلب المستخدمون تنفيذ خوارزمية RL، أو تدريب الوكيل، أو تصميم البيئة، أو تجربة RL. المصدر: ovachiever/droid-tings.

كيف أثبّت stable-baselines3؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/ovachiever/droid-tings --skill stable-baselines3 بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

أين مستودع المصدر؟

https://github.com/ovachiever/droid-tings