·slime-user
</>

slime-user

Guida per l'utilizzo di SLIME (framework post-formazione LLM per RL Scaling). Da utilizzare quando si lavora con SLIME per la formazione con apprendimento per rinforzo di modelli linguistici, tra cui impostazione, configurazione, esecuzione della formazione, interazioni multi-turno, modelli di ricompensa personalizzati, scenari di chiamata di strumenti o risoluzione dei problemi dei flussi di lavoro SLIME. Copre GRPO, GSPO, PPO, Reinforce++, RL multi-agente, formazione VLM, backend FSDP/Megatron, integrazione SGLang, campionamento dinamico e funzioni di generazione personalizzata.

7Installazioni·0Tendenza·@yzlnew

Installazione

$npx skills add https://github.com/yzlnew/infra-skills --skill slime-user

Come installare slime-user

Installa rapidamente la skill AI slime-user nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/yzlnew/infra-skills --skill slime-user
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: yzlnew/infra-skills.

SLIME is an LLM post-training framework for RL Scaling developed by THUDM. It supports various RL algorithms (GRPO, GSPO, PPO, Reinforce++), multiple training backends (Megatron, FSDP), and advanced features like multi-turn interactions, tool calling, and dynamic sampling.

SLIME has extensive documentation. Use this guide to find what you need quickly.

For detailed navigation of all documentation, see references/docnavigation.md.

Guida per l'utilizzo di SLIME (framework post-formazione LLM per RL Scaling). Da utilizzare quando si lavora con SLIME per la formazione con apprendimento per rinforzo di modelli linguistici, tra cui impostazione, configurazione, esecuzione della formazione, interazioni multi-turno, modelli di ricompensa personalizzati, scenari di chiamata di strumenti o risoluzione dei problemi dei flussi di lavoro SLIME. Copre GRPO, GSPO, PPO, Reinforce++, RL multi-agente, formazione VLM, backend FSDP/Megatron, integrazione SGLang, campionamento dinamico e funzioni di generazione personalizzata. Fonte: yzlnew/infra-skills.

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/yzlnew/infra-skills --skill slime-user
Categoria
</>Sviluppo
Verificato
Prima apparizione
2026-02-01
Aggiornato
2026-03-10

Browse more skills from yzlnew/infra-skills

Risposte rapide

Che cos'è slime-user?

Guida per l'utilizzo di SLIME (framework post-formazione LLM per RL Scaling). Da utilizzare quando si lavora con SLIME per la formazione con apprendimento per rinforzo di modelli linguistici, tra cui impostazione, configurazione, esecuzione della formazione, interazioni multi-turno, modelli di ricompensa personalizzati, scenari di chiamata di strumenti o risoluzione dei problemi dei flussi di lavoro SLIME. Copre GRPO, GSPO, PPO, Reinforce++, RL multi-agente, formazione VLM, backend FSDP/Megatron, integrazione SGLang, campionamento dinamico e funzioni di generazione personalizzata. Fonte: yzlnew/infra-skills.

Come installo slime-user?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/yzlnew/infra-skills --skill slime-user Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/yzlnew/infra-skills

Dettagli

Categoria
</>Sviluppo
Fonte
skills.sh
Prima apparizione
2026-02-01