slime-user

Name: slime-user
Author: yzlnew

Che cos'è slime-user?

Guida per l'utilizzo di SLIME (framework post-formazione LLM per RL Scaling). Da utilizzare quando si lavora con SLIME per la formazione con apprendimento per rinforzo di modelli linguistici, tra cui impostazione, configurazione, esecuzione della formazione, interazioni multi-turno, modelli di ricompensa personalizzati, scenari di chiamata di strumenti o risoluzione dei problemi dei flussi di lavoro SLIME. Copre GRPO, GSPO, PPO, Reinforce++, RL multi-agente, formazione VLM, backend FSDP/Megatron, integrazione SGLang, campionamento dinamico e funzioni di generazione personalizzata. Fonte: yzlnew/infra-skills.

Come installo slime-user?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/yzlnew/infra-skills --skill slime-user Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/yzlnew/infra-skills

Installazione

Dettagli

Skills correlate

slime-user

Installazione

Come installare slime-user

SKILL.md

Fatti (pronti per citazione)

Risposte rapide

Che cos'è slime-user?

Come installo slime-user?

Dov'è il repository sorgente?

Dettagli

Skills correlate