slime-user

Name: slime-user
Author: yzlnew

✓

Leitfaden zur Verwendung von SLIME (LLM-Post-Training-Framework für RL-Skalierung). Verwenden Sie es bei der Arbeit mit SLIME für das Reinforcement-Learning-Training von Sprachmodellen, einschließlich Einrichtung, Konfiguration, Trainingsausführung, Multi-Turn-Interaktionen, benutzerdefinierten Belohnungsmodellen, Tool-Aufrufszenarien oder Fehlerbehebung bei SLIME-Workflows. Deckt GRPO, GSPO, PPO, Reinforce++, Multi-Agent-RL, VLM-Training, FSDP/Megatron-Backends, SGLang-Integration, dynamische Stichproben und benutzerdefinierte Generierungsfunktionen ab.

yzlnew·slime·user

5Installationen·0Trend·@yzlnew

Installation

$npx skills add https://github.com/yzlnew/infra-skills --skill slime-user

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-01

slime-user

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist slime-user?

Wie installiere ich slime-user?

Wo ist das Quell-Repository?

Details

Verwandte Skills