openrlhf-training

Name: openrlhf-training
Author: ovachiever

✓

ovachiever/droid-tings

Высокопроизводительная платформа RLHF с ускорением Ray+vLLM. Используется для обучения PPO, GRPO, RLOO, DPO больших моделей (7B-70B+). Построен на базе Ray, vLLM, ZeRO-3. В 2 раза быстрее, чем DeepSpeedChat, благодаря распределенной архитектуре и совместному использованию ресурсов графического процессора.

ovachiever·openrlhf·training

28Установки·0Тренд·@ovachiever

Установка

$npx skills add https://github.com/ovachiever/droid-tings --skill openrlhf-training

Детали

Категория: </>Разработка
Источник: skills.sh
Впервые замечено: 2026-03-03

openrlhf-training

Установка

Как установить openrlhf-training

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое openrlhf-training?

Как установить openrlhf-training?

Где находится исходный репозиторий?

Детали

Похожие навыки