openrlhf-training

Name: openrlhf-training
Author: orchestra-research

✓

Ray+vLLM 가속 기능을 갖춘 고성능 RLHF 프레임워크. 대형 모델(7B-70B+)의 PPO, GRPO, RLOO, DPO 교육에 사용합니다. Ray, vLLM, ZeRO-3을 기반으로 구축되었습니다. 분산 아키텍처 및 GPU 리소스 공유를 통해 DeepSpeedChat보다 2배 빠릅니다.

orchestra-research·openrlhf·training

15설치·0트렌드·@orchestra-research

설치

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill openrlhf-training

상세

카테고리: </>개발 도구
출처: skills.sh
최초 등록: 2026-02-11

openrlhf-training

설치

SKILL.md

인용 가능한 정보

빠른 답변

openrlhf-training이란?

openrlhf-training 설치 방법은?

소스 저장소는 어디인가요?

상세

관련 Skills