stable-baselines3
✓Utilice esta habilidad para reforzar tareas de aprendizaje, incluida la capacitación de agentes de RL (PPO, SAC, DQN, TD3, DDPG, A2C, etc.), la creación de entornos de gimnasio personalizados, la implementación de devoluciones de llamadas para monitoreo y control, el uso de entornos vectorizados para entrenamiento paralelo y la integración con flujos de trabajo de RL profundos. Esta habilidad debe usarse cuando los usuarios solicitan la implementación de algoritmos de RL, capacitación de agentes, diseño de entornos o experimentación de RL.
Instalación
SKILL.md
Stable Baselines3 (SB3) is a PyTorch-based library providing reliable implementations of reinforcement learning algorithms. This skill provides comprehensive guidance for training RL agents, creating custom environments, implementing callbacks, and optimizing training workflows using SB3's unified API.
Algorithm Selection: Use references/algorithms.md for detailed algorithm characteristics and selection guidance. Quick reference:
See scripts/trainrlagent.py for a complete training template with best practices.
Utilice esta habilidad para reforzar tareas de aprendizaje, incluida la capacitación de agentes de RL (PPO, SAC, DQN, TD3, DDPG, A2C, etc.), la creación de entornos de gimnasio personalizados, la implementación de devoluciones de llamadas para monitoreo y control, el uso de entornos vectorizados para entrenamiento paralelo y la integración con flujos de trabajo de RL profundos. Esta habilidad debe usarse cuando los usuarios solicitan la implementación de algoritmos de RL, capacitación de agentes, diseño de entornos o experimentación de RL. Fuente: ovachiever/droid-tings.
Datos (listos para citar)
Campos y comandos estables para citas de IA/búsqueda.
- Comando de instalación
npx skills add https://github.com/ovachiever/droid-tings --skill stable-baselines3- Fuente
- ovachiever/droid-tings
- Categoría
- </>Desarrollo
- Verificado
- ✓
- Primera vez visto
- 2026-02-01
- Actualizado
- 2026-02-18
Respuestas rápidas
¿Qué es stable-baselines3?
Utilice esta habilidad para reforzar tareas de aprendizaje, incluida la capacitación de agentes de RL (PPO, SAC, DQN, TD3, DDPG, A2C, etc.), la creación de entornos de gimnasio personalizados, la implementación de devoluciones de llamadas para monitoreo y control, el uso de entornos vectorizados para entrenamiento paralelo y la integración con flujos de trabajo de RL profundos. Esta habilidad debe usarse cuando los usuarios solicitan la implementación de algoritmos de RL, capacitación de agentes, diseño de entornos o experimentación de RL. Fuente: ovachiever/droid-tings.
¿Cómo instalo stable-baselines3?
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/ovachiever/droid-tings --skill stable-baselines3 Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
¿Dónde está el repositorio de origen?
https://github.com/ovachiever/droid-tings
Detalles
- Categoría
- </>Desarrollo
- Fuente
- skills.sh
- Primera vez visto
- 2026-02-01