·pufferlib
</>

pufferlib

jackspace/claudeskillz

在处理强化学习任务时应使用此技能,包括高性能 RL 训练、自定义环境开发、矢量化并行模拟、多智能体系统或与现有 RL 环境(Gymnasium、PettingZoo、Atari、Procgen 等)集成。使用此技能来实施 PPO 训练、创建 PufferEnv 环境、优化 RL 性能或使用 CNN/LSTM 开发策略。

13安装·0热度·@jackspace

安装

$npx skills add https://github.com/jackspace/claudeskillz --skill pufferlib

SKILL.md

PufferLib is a high-performance reinforcement learning library designed for fast parallel environment simulation and training. It achieves training at millions of steps per second through optimized vectorization, native multi-agent support, and efficient PPO implementation (PuffeRL). The library provides the Ocean suite of 20+ environments and seamless integration with Gymnasium, PettingZoo, and specialized RL fra...

PuffeRL is PufferLib's optimized PPO+LSTM training algorithm achieving 1M-4M steps/second.

Use the template script: scripts/envtemplate.py provides complete single-agent and multi-agent environment templates with examples of:

在处理强化学习任务时应使用此技能,包括高性能 RL 训练、自定义环境开发、矢量化并行模拟、多智能体系统或与现有 RL 环境(Gymnasium、PettingZoo、Atari、Procgen 等)集成。使用此技能来实施 PPO 训练、创建 PufferEnv 环境、优化 RL 性能或使用 CNN/LSTM 开发策略。 来源:jackspace/claudeskillz。

查看原文

可引用信息

为搜索与 AI 引用准备的稳定字段与命令。

安装命令
npx skills add https://github.com/jackspace/claudeskillz --skill pufferlib
分类
</>开发工具
认证
收录时间
2026-02-17
更新时间
2026-02-18

快速解答

什么是 pufferlib?

在处理强化学习任务时应使用此技能,包括高性能 RL 训练、自定义环境开发、矢量化并行模拟、多智能体系统或与现有 RL 环境(Gymnasium、PettingZoo、Atari、Procgen 等)集成。使用此技能来实施 PPO 训练、创建 PufferEnv 环境、优化 RL 性能或使用 CNN/LSTM 开发策略。 来源:jackspace/claudeskillz。

如何安装 pufferlib?

打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/jackspace/claudeskillz --skill pufferlib 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code 或 Cursor 中使用

这个 Skill 的源码在哪?

https://github.com/jackspace/claudeskillz