openrlhf-training

Name: openrlhf-training
Author: orchestra-research

✓

Hochleistungsfähiges RLHF-Framework mit Ray+vLLM-Beschleunigung. Verwendung für PPO-, GRPO-, RLOO- und DPO-Training großer Modelle (7B-70B+). Basierend auf Ray, vLLM, ZeRO-3. 2× schneller als DeepSpeedChat mit verteilter Architektur und gemeinsamer GPU-Ressourcennutzung.

orchestra-research·openrlhf·training

15Installationen·0Trend·@orchestra-research

Installation

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill openrlhf-training

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-11

openrlhf-training

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist openrlhf-training?

Wie installiere ich openrlhf-training?

Wo ist das Quell-Repository?

Details

Verwandte Skills