pufferlib
✓在处理强化学习任务时应使用此技能,包括高性能 RL 训练、自定义环境开发、矢量化并行模拟、多智能体系统或与现有 RL 环境(Gymnasium、PettingZoo、Atari、Procgen 等)集成。使用此技能来实施 PPO 训练、创建 PufferEnv 环境、优化 RL 性能或使用 CNN/LSTM 开发策略。
SKILL.md
PufferLib is a high-performance reinforcement learning library designed for fast parallel environment simulation and training. It achieves training at millions of steps per second through optimized vectorization, native multi-agent support, and efficient PPO implementation (PuffeRL). The library provides the Ocean suite of 20+ environments and seamless integration with Gymnasium, PettingZoo, and specialized RL fra...
PuffeRL is PufferLib's optimized PPO+LSTM training algorithm achieving 1M-4M steps/second.
Use the template script: scripts/envtemplate.py provides complete single-agent and multi-agent environment templates with examples of:
在处理强化学习任务时应使用此技能,包括高性能 RL 训练、自定义环境开发、矢量化并行模拟、多智能体系统或与现有 RL 环境(Gymnasium、PettingZoo、Atari、Procgen 等)集成。使用此技能来实施 PPO 训练、创建 PufferEnv 环境、优化 RL 性能或使用 CNN/LSTM 开发策略。 来源:ovachiever/droid-tings。
可引用信息
为搜索与 AI 引用准备的稳定字段与命令。
- 安装命令
npx skills add https://github.com/ovachiever/droid-tings --skill pufferlib- 分类
- </>开发工具
- 认证
- ✓
- 收录时间
- 2026-02-01
- 更新时间
- 2026-02-18
快速解答
什么是 pufferlib?
在处理强化学习任务时应使用此技能,包括高性能 RL 训练、自定义环境开发、矢量化并行模拟、多智能体系统或与现有 RL 环境(Gymnasium、PettingZoo、Atari、Procgen 等)集成。使用此技能来实施 PPO 训练、创建 PufferEnv 环境、优化 RL 性能或使用 CNN/LSTM 开发策略。 来源:ovachiever/droid-tings。
如何安装 pufferlib?
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/ovachiever/droid-tings --skill pufferlib 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code 或 Cursor 中使用
这个 Skill 的源码在哪?
https://github.com/ovachiever/droid-tings
详情
- 分类
- </>开发工具
- 来源
- skills.sh
- 收录时间
- 2026-02-01