·openrlhf-training

</>

openrlhf-training

✓

ovachiever/droid-tings

具有 Ray+vLLM 加速功能的高性能 RLHF 框架。用于大型模型（7B-70B+）的PPO、GRPO、RLOO、DPO训练。基于 Ray、vLLM、ZeRO-3 构建。比 DeepSpeedChat 快 2 倍，具有分布式架构和 GPU 资源共享。

ovachiever·openrlhf·training

28安装·0热度·@ovachiever

安装

$npx skills add https://github.com/ovachiever/droid-tings --skill openrlhf-training

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-03-03

相关 Skills

security-auditor

react-hook-form-zod

nextjs-shadcn-builder

deep-reading-analyst

react-native-expo

threejs-graphics-optimizer