openrlhf-training

Name: openrlhf-training
Author: ovachiever

✓

ovachiever/droid-tings

Leistungsstarkes RLHF-Framework mit Ray+vLLM-Beschleunigung. Verwendung für PPO-, GRPO-, RLOO- und DPO-Training großer Modelle (7B-70B+). Basierend auf Ray, vLLM, ZeRO-3. 2× schneller als DeepSpeedChat mit verteilter Architektur und gemeinsamer GPU-Ressourcennutzung.

ovachiever·openrlhf·training

28Installationen·0Trend·@ovachiever

Installation

$npx skills add https://github.com/ovachiever/droid-tings --skill openrlhf-training

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-03-03

openrlhf-training

Installation

So installieren Sie openrlhf-training

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist openrlhf-training?

Wie installiere ich openrlhf-training?

Wo ist das Quell-Repository?

Details

Verwandte Skills