slime-user

Name: slime-user
Author: yzlnew

✓

使用 SLIME（用于 RL 扩展的 LLM 后培训框架）的指南。使用 SLIME 进行语言模型的强化学习训练，包括设置、配置、训练执行、多轮交互、自定义奖励模型、工具调用场景或 SLIME 工作流程故障排除。涵盖 GRPO、GSPO、PPO、Reinforce++、多智能体 RL、VLM 训练、FSDP/Megatron 后端、SGLang 集成、动态采样和自定义生成功能。

yzlnew·slime·user

5安装·0热度·@yzlnew

安装

$npx skills add https://github.com/yzlnew/infra-skills --skill slime-user

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-01

slime-user

安装

SKILL.md

可引用信息

快速解答

什么是 slime-user？

如何安装 slime-user？

这个 Skill 的源码在哪？

详情

相关 Skills