slime-user

Name: slime-user
Author: yzlnew

✓

SLIME (RL スケーリング用の LLM ポストトレーニングフレームワーク) の使用ガイド。セットアップ、構成、トレーニングの実行、マルチターンインタラクション、カスタム報酬モデル、ツール呼び出しシナリオ、SLIME ワークフローのトラブルシューティングなど、言語モデルの強化学習トレーニングのために SLIME を使用する場合に使用します。 GRPO、GSPO、PPO、Reinforce++、マルチエージェント RL、VLM トレーニング、FSDP/Megatron バックエンド、SGLang 統合、動的サンプリング、カスタム生成機能をカバーします。

yzlnew·slime·user

5インストール·0トレンド·@yzlnew

インストール

$npx skills add https://github.com/yzlnew/infra-skills --skill slime-user

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-01

slime-user

インストール

SKILL.md

引用可能な情報

クイックアンサー

slime-user とは？

slime-user のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills