·miles-rl-training
</>

miles-rl-training

Fornisce indicazioni per la formazione RL di livello aziendale utilizzando miglia, una forchetta di melma pronta per la produzione. Da utilizzare durante l'addestramento di modelli MoE di grandi dimensioni con FP8/INT4, che necessitano di allineamento dell'inferenza del treno o di RL speculativo per la massima produttività.

38Installazioni·1Tendenza·@orchestra-research

Installazione

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training

Come installare miles-rl-training

Installa rapidamente la skill AI miles-rl-training nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: orchestra-research/ai-research-skills.

miles is a high-performance, enterprise-ready RL framework optimized for large-scale model post-training. Built as a production fork of slime, it addresses critical challenges in MoE training stability, low-precision training, and train-inference alignment.

Use this workflow for training large MoE models like DeepSeek V3 or Qwen3-MoE.

Use this workflow for maximum rollout throughput with EAGLE speculative decoding.

Fornisce indicazioni per la formazione RL di livello aziendale utilizzando miglia, una forchetta di melma pronta per la produzione. Da utilizzare durante l'addestramento di modelli MoE di grandi dimensioni con FP8/INT4, che necessitano di allineamento dell'inferenza del treno o di RL speculativo per la massima produttività. Fonte: orchestra-research/ai-research-skills.

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training
Categoria
</>Sviluppo
Verificato
Prima apparizione
2026-02-11
Aggiornato
2026-03-10

Browse more skills from orchestra-research/ai-research-skills

Risposte rapide

Che cos'è miles-rl-training?

Fornisce indicazioni per la formazione RL di livello aziendale utilizzando miglia, una forchetta di melma pronta per la produzione. Da utilizzare durante l'addestramento di modelli MoE di grandi dimensioni con FP8/INT4, che necessitano di allineamento dell'inferenza del treno o di RL speculativo per la massima produttività. Fonte: orchestra-research/ai-research-skills.

Come installo miles-rl-training?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/orchestra-research/ai-research-skills