openrlhf-training

Name: openrlhf-training
Author: ovachiever

✓

ovachiever/droid-tings

Ray+vLLM 가속 기능을 갖춘 고성능 RLHF 프레임워크. 대형 모델(7B-70B+)의 PPO, GRPO, RLOO, DPO 교육에 사용합니다. Ray, vLLM, ZeRO-3을 기반으로 구축되었습니다. 분산 아키텍처 및 GPU 리소스 공유를 통해 DeepSpeedChat보다 2배 빠릅니다.

ovachiever·openrlhf·training

28설치·0트렌드·@ovachiever

설치

$npx skills add https://github.com/ovachiever/droid-tings --skill openrlhf-training

상세

카테고리: </>개발 도구
출처: skills.sh
최초 등록: 2026-03-03

openrlhf-training

설치

openrlhf-training 설치 방법

SKILL.md

인용 가능한 정보

빠른 답변

openrlhf-training이란?

openrlhf-training 설치 방법은?

소스 저장소는 어디인가요?

상세

관련 Skills