·miles-rl-training

</>

miles-rl-training

✓

orchestra-research/ai-research-skills

为使用 Miles（一种可立即投入生产的 Slime 分支）进行企业级 RL 训练提供指导。当使用 FP8/INT4 训练大型 MoE 模型、需要训练推理对齐或需要推测 RL 以获得最大吞吐量时使用。

orchestra-research·miles·rl·training

16安装·1热度·@orchestra-research

安装

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill miles-rl-training

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-11

相关 Skills

ml-paper-writing

serving-llms-vllm