·openrlhf-training
</>

openrlhf-training

orchestra-research/ai-research-skills

Hochleistungsfähiges RLHF-Framework mit Ray+vLLM-Beschleunigung. Verwendung für PPO-, GRPO-, RLOO- und DPO-Training großer Modelle (7B-70B+). Basierend auf Ray, vLLM, ZeRO-3. 2× schneller als DeepSpeedChat mit verteilter Architektur und gemeinsamer GPU-Ressourcennutzung.

15Installationen·0Trend·@orchestra-research

Installation

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill openrlhf-training

SKILL.md

OpenRLHF is a Ray-based RLHF framework optimized for distributed training with vLLM inference acceleration.

Workflow 1: Full RLHF pipeline (SFT → Reward Model → PPO)

Hybrid Engine GPU sharing: See references/hybrid-engine.md for vLLM sleep mode, DeepSpeed sleep mode, and optimal node allocation.

Hochleistungsfähiges RLHF-Framework mit Ray+vLLM-Beschleunigung. Verwendung für PPO-, GRPO-, RLOO- und DPO-Training großer Modelle (7B-70B+). Basierend auf Ray, vLLM, ZeRO-3. 2× schneller als DeepSpeedChat mit verteilter Architektur und gemeinsamer GPU-Ressourcennutzung. Quelle: orchestra-research/ai-research-skills.

Original anzeigen

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/orchestra-research/ai-research-skills --skill openrlhf-training
Kategorie
</>Entwicklung
Verifiziert
Erstes Auftreten
2026-02-11
Aktualisiert
2026-02-18

Schnelle Antworten

Was ist openrlhf-training?

Hochleistungsfähiges RLHF-Framework mit Ray+vLLM-Beschleunigung. Verwendung für PPO-, GRPO-, RLOO- und DPO-Training großer Modelle (7B-70B+). Basierend auf Ray, vLLM, ZeRO-3. 2× schneller als DeepSpeedChat mit verteilter Architektur und gemeinsamer GPU-Ressourcennutzung. Quelle: orchestra-research/ai-research-skills.

Wie installiere ich openrlhf-training?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/orchestra-research/ai-research-skills --skill openrlhf-training Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Wo ist das Quell-Repository?

https://github.com/orchestra-research/ai-research-skills