·miles-rl-training
</>

miles-rl-training

orchestra-research/ai-research-skills

Proporciona orientación para la capacitación de RL de nivel empresarial utilizando miles, un tenedor de limo listo para producción. Úselo cuando entrene modelos MoE grandes con FP8/INT4, necesite alineación de inferencia de tren o requiera RL especulativo para obtener el máximo rendimiento.

16Instalaciones·1Tendencia·@orchestra-research

Instalación

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training

SKILL.md

miles is a high-performance, enterprise-ready RL framework optimized for large-scale model post-training. Built as a production fork of slime, it addresses critical challenges in MoE training stability, low-precision training, and train-inference alignment.

Use this workflow for training large MoE models like DeepSeek V3 or Qwen3-MoE.

Use this workflow for maximum rollout throughput with EAGLE speculative decoding.

Proporciona orientación para la capacitación de RL de nivel empresarial utilizando miles, un tenedor de limo listo para producción. Úselo cuando entrene modelos MoE grandes con FP8/INT4, necesite alineación de inferencia de tren o requiera RL especulativo para obtener el máximo rendimiento. Fuente: orchestra-research/ai-research-skills.

Ver original

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training
Categoría
</>Desarrollo
Verificado
Primera vez visto
2026-02-11
Actualizado
2026-02-18

Respuestas rápidas

¿Qué es miles-rl-training?

Proporciona orientación para la capacitación de RL de nivel empresarial utilizando miles, un tenedor de limo listo para producción. Úselo cuando entrene modelos MoE grandes con FP8/INT4, necesite alineación de inferencia de tren o requiera RL especulativo para obtener el máximo rendimiento. Fuente: orchestra-research/ai-research-skills.

¿Cómo instalo miles-rl-training?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor

¿Dónde está el repositorio de origen?

https://github.com/orchestra-research/ai-research-skills