·miles-rl-training
</>

miles-rl-training

orchestra-research/ai-research-skills

Bietet Anleitungen für RL-Schulungen auf Unternehmensniveau mit Miles, einem produktionsreifen Schleimzweig. Wird verwendet, wenn große MoE-Modelle mit FP8/INT4 trainiert werden, eine Zug-Inferenz-Ausrichtung erforderlich ist oder spekulatives RL für maximalen Durchsatz erforderlich ist.

15Installationen·0Trend·@orchestra-research

Installation

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training

SKILL.md

miles is a high-performance, enterprise-ready RL framework optimized for large-scale model post-training. Built as a production fork of slime, it addresses critical challenges in MoE training stability, low-precision training, and train-inference alignment.

Use this workflow for training large MoE models like DeepSeek V3 or Qwen3-MoE.

Use this workflow for maximum rollout throughput with EAGLE speculative decoding.

Bietet Anleitungen für RL-Schulungen auf Unternehmensniveau mit Miles, einem produktionsreifen Schleimzweig. Wird verwendet, wenn große MoE-Modelle mit FP8/INT4 trainiert werden, eine Zug-Inferenz-Ausrichtung erforderlich ist oder spekulatives RL für maximalen Durchsatz erforderlich ist. Quelle: orchestra-research/ai-research-skills.

Original anzeigen

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training
Kategorie
</>Entwicklung
Verifiziert
Erstes Auftreten
2026-02-11
Aktualisiert
2026-02-18

Schnelle Antworten

Was ist miles-rl-training?

Bietet Anleitungen für RL-Schulungen auf Unternehmensniveau mit Miles, einem produktionsreifen Schleimzweig. Wird verwendet, wenn große MoE-Modelle mit FP8/INT4 trainiert werden, eine Zug-Inferenz-Ausrichtung erforderlich ist oder spekulatives RL für maximalen Durchsatz erforderlich ist. Quelle: orchestra-research/ai-research-skills.

Wie installiere ich miles-rl-training?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Wo ist das Quell-Repository?

https://github.com/orchestra-research/ai-research-skills