·stable-baselines3

</>

stable-baselines3

✓

ovachiever/droid-tings

使用此技能执行强化学习任务，包括训练 RL 代理（PPO、SAC、DQN、TD3、DDPG、A2C 等）、创建自定义 Gym 环境、实现用于监视和控制的回调、使用矢量化环境进行并行训练以及与深度 RL 工作流程集成。当用户请求 RL 算法实现、代理训练、环境设计或 RL 实验时，应该使用此技能。

ovachiever·stable·baselines3

22安装·0热度·@ovachiever

安装

$npx skills add https://github.com/ovachiever/droid-tings --skill stable-baselines3

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-01

相关 Skills

security-auditor

nextjs-shadcn-builder

threejs-graphics-optimizer

deep-reading-analyst

tailwind-v4-shadcn

react-hook-form-zod