¿Cómo instalo openrlhf-training?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/ovachiever/droid-tings --skill openrlhf-training Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code, Cursor u OpenClaw

·openrlhf-training

</>

openrlhf-training

Name: openrlhf-training
Author: ovachiever

✓

ovachiever/droid-tings

Marco RLHF de alto rendimiento con aceleración Ray+vLLM. Uso para entrenamiento PPO, GRPO, RLOO, DPO de modelos grandes (7B-70B+). Construido sobre Ray, vLLM, ZeRO-3. 2 veces más rápido que DeepSpeedChat con arquitectura distribuida y uso compartido de recursos de GPU.

ovachiever·openrlhf·training

28Instalaciones·0Tendencia·@ovachiever