slime-user

Name: slime-user
Author: yzlnew

✓

使用 SLIME（用於 RL 擴展的 LLM 後培訓框架）的指南。使用 SLIME 進行語言模型的強化學習訓練，包括設置、配置、訓練執行、多輪交互、自定義獎勵模型、工具調用場景或 SLIME 工作流程故障排除。涵蓋 GRPO、GSPO、PPO、Reinforce++、多智能體 RL、VLM 訓練、FSDP/Megatron 後端、SGLang 集成、動態採樣和自定義生成功能。

yzlnew·slime·user

5安裝·0熱度·@yzlnew

安裝

$npx skills add https://github.com/yzlnew/infra-skills --skill slime-user

詳情

分類: </>開發工具
來源: skills.sh
收錄時間: 2026-02-01

slime-user

安裝

SKILL.md

可引用資訊

快速解答

什麼是 slime-user？

如何安裝 slime-user？

這個 Skill 的原始碼在哪？

詳情

相關 Skills