·slime-rl-training

{}

slime-rl-training

✓

orchestra-research/ai-research-skills

为使用 Slime（Megatron+SGLang 框架）进行 RL 的 LLM 后期训练提供指导。在训练 GLM 模型、实施自定义数据生成工作流程或需要紧密的 Megatron-LM 集成以进行 RL 扩展时使用。

orchestra-research·slime·rl·training

16安装·1热度·@orchestra-research

安装

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training

详情

分类: {}数据分析
来源: skills.sh
收录时间: 2026-02-11

相关 Skills

ml-paper-writing

serving-llms-vllm