·miles-rl-training

</>

miles-rl-training

✓

orchestra-research/ai-research-skills

생산 준비가 완료된 슬라임 포크인 마일을 사용하여 엔터프라이즈급 RL 교육에 대한 지침을 제공합니다. FP8/INT4를 사용하여 대규모 MoE 모델을 교육할 때, 열차 추론 정렬이 필요하거나 최대 처리량을 위해 추측적 RL이 필요한 경우에 사용하세요.

orchestra-research·miles·rl·training

15설치·0트렌드·@orchestra-research

설치

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training

상세

카테고리: </>개발 도구
출처: skills.sh
최초 등록: 2026-02-11

관련 Skills

ml-paper-writing

serving-llms-vllm