openrlhf-training

Name: openrlhf-training
Author: ovachiever

✓

ovachiever/droid-tings

Ray+vLLM アクセラレーションを備えた高性能 RLHF フレームワーク。大規模モデル (7B-70B+) の PPO、GRPO、RLOO、DPO トレーニングに使用します。 Ray、vLLM、ZeRO-3 に基づいて構築されています。分散アーキテクチャと GPU リソース共有により、DeepSpeedChat よりも 2 倍高速です。

ovachiever·openrlhf·training

28インストール·0トレンド·@ovachiever

インストール

$npx skills add https://github.com/ovachiever/droid-tings --skill openrlhf-training

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-03-03

openrlhf-training

インストール

openrlhf-training のインストール方法

SKILL.md

引用可能な情報

クイックアンサー

openrlhf-training とは？

openrlhf-training のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills