openrlhf-training
✓Marco RLHF de alto rendimiento con aceleración Ray+vLLM. Uso para entrenamiento PPO, GRPO, RLOO, DPO de modelos grandes (7B-70B+). Construido sobre Ray, vLLM, ZeRO-3. 2 veces más rápido que DeepSpeedChat con arquitectura distribuida y uso compartido de recursos de GPU.
SKILL.md
OpenRLHF is a Ray-based RLHF framework optimized for distributed training with vLLM inference acceleration.
Workflow 1: Full RLHF pipeline (SFT → Reward Model → PPO)
Hybrid Engine GPU sharing: See references/hybrid-engine.md for vLLM sleep mode, DeepSpeed sleep mode, and optimal node allocation.
Marco RLHF de alto rendimiento con aceleración Ray+vLLM. Uso para entrenamiento PPO, GRPO, RLOO, DPO de modelos grandes (7B-70B+). Construido sobre Ray, vLLM, ZeRO-3. 2 veces más rápido que DeepSpeedChat con arquitectura distribuida y uso compartido de recursos de GPU. Fuente: orchestra-research/ai-research-skills.
Datos (listos para citar)
Campos y comandos estables para citas de IA/búsqueda.
- Comando de instalación
npx skills add https://github.com/orchestra-research/ai-research-skills --skill openrlhf-training- Categoría
- </>Desarrollo
- Verificado
- ✓
- Primera vez visto
- 2026-02-11
- Actualizado
- 2026-02-18
Respuestas rápidas
¿Qué es openrlhf-training?
Marco RLHF de alto rendimiento con aceleración Ray+vLLM. Uso para entrenamiento PPO, GRPO, RLOO, DPO de modelos grandes (7B-70B+). Construido sobre Ray, vLLM, ZeRO-3. 2 veces más rápido que DeepSpeedChat con arquitectura distribuida y uso compartido de recursos de GPU. Fuente: orchestra-research/ai-research-skills.
¿Cómo instalo openrlhf-training?
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/orchestra-research/ai-research-skills --skill openrlhf-training Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
¿Dónde está el repositorio de origen?
https://github.com/orchestra-research/ai-research-skills
Detalles
- Categoría
- </>Desarrollo
- Fuente
- skills.sh
- Primera vez visto
- 2026-02-11