·stable-baselines3
</>

stable-baselines3

Используйте этот навык для задач обучения с подкреплением, включая обучение агентов RL (PPO, SAC, DQN, TD3, DDPG, A2C и т. д.), создание пользовательских сред Gym, реализацию обратных вызовов для мониторинга и управления, использование векторизованных сред для параллельного обучения и интеграцию с глубокими рабочими процессами RL. Этот навык следует использовать, когда пользователи запрашивают реализацию алгоритма RL, обучение агентов, проектирование среды или экспериментирование с RL.

27Установки·0Тренд·@ovachiever

Установка

$npx skills add https://github.com/ovachiever/droid-tings --skill stable-baselines3

Как установить stable-baselines3

Быстро установите AI-навык stable-baselines3 в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/ovachiever/droid-tings --skill stable-baselines3
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: ovachiever/droid-tings.

Stable Baselines3 (SB3) is a PyTorch-based library providing reliable implementations of reinforcement learning algorithms. This skill provides comprehensive guidance for training RL agents, creating custom environments, implementing callbacks, and optimizing training workflows using SB3's unified API.

Algorithm Selection: Use references/algorithms.md for detailed algorithm characteristics and selection guidance. Quick reference:

See scripts/trainrlagent.py for a complete training template with best practices.

Используйте этот навык для задач обучения с подкреплением, включая обучение агентов RL (PPO, SAC, DQN, TD3, DDPG, A2C и т. д.), создание пользовательских сред Gym, реализацию обратных вызовов для мониторинга и управления, использование векторизованных сред для параллельного обучения и интеграцию с глубокими рабочими процессами RL. Этот навык следует использовать, когда пользователи запрашивают реализацию алгоритма RL, обучение агентов, проектирование среды или экспериментирование с RL. Источник: ovachiever/droid-tings.

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/ovachiever/droid-tings --skill stable-baselines3
Источник
ovachiever/droid-tings
Категория
</>Разработка
Проверено
Впервые замечено
2026-02-01
Обновлено
2026-03-11

Browse more skills from ovachiever/droid-tings

Короткие ответы

Что такое stable-baselines3?

Используйте этот навык для задач обучения с подкреплением, включая обучение агентов RL (PPO, SAC, DQN, TD3, DDPG, A2C и т. д.), создание пользовательских сред Gym, реализацию обратных вызовов для мониторинга и управления, использование векторизованных сред для параллельного обучения и интеграцию с глубокими рабочими процессами RL. Этот навык следует использовать, когда пользователи запрашивают реализацию алгоритма RL, обучение агентов, проектирование среды или экспериментирование с RL. Источник: ovachiever/droid-tings.

Как установить stable-baselines3?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/ovachiever/droid-tings --skill stable-baselines3 После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/ovachiever/droid-tings