·simpo-training
</>

simpo-training

Semplice ottimizzazione delle preferenze per l'allineamento LLM. Alternativa senza riferimenti a DPO con prestazioni migliori (+6,4 punti su AlpacaEval 2.0). Non è necessario alcun modello di riferimento, più efficiente del DPO. Da utilizzare per l'allineamento delle preferenze quando si desidera una formazione più semplice e veloce rispetto a DPO/PPO.

27Installazioni·0Tendenza·@ovachiever

Installazione

$npx skills add https://github.com/ovachiever/droid-tings --skill simpo-training

Come installare simpo-training

Installa rapidamente la skill AI simpo-training nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/ovachiever/droid-tings --skill simpo-training
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: ovachiever/droid-tings.

SimPO is a reference-free preference optimization method that outperforms DPO without needing a reference model.

Loss functions: See references/loss-functions.md for sigmoid vs hinge loss, mathematical formulations, and when to use each.

Hyperparameter tuning: See references/hyperparameters.md for beta, gamma, learning rate selection guide, and model-size-specific recommendations.

Semplice ottimizzazione delle preferenze per l'allineamento LLM. Alternativa senza riferimenti a DPO con prestazioni migliori (+6,4 punti su AlpacaEval 2.0). Non è necessario alcun modello di riferimento, più efficiente del DPO. Da utilizzare per l'allineamento delle preferenze quando si desidera una formazione più semplice e veloce rispetto a DPO/PPO. Fonte: ovachiever/droid-tings.

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/ovachiever/droid-tings --skill simpo-training
Categoria
</>Sviluppo
Verificato
Prima apparizione
2026-03-03
Aggiornato
2026-03-10

Browse more skills from ovachiever/droid-tings

Risposte rapide

Che cos'è simpo-training?

Semplice ottimizzazione delle preferenze per l'allineamento LLM. Alternativa senza riferimenti a DPO con prestazioni migliori (+6,4 punti su AlpacaEval 2.0). Non è necessario alcun modello di riferimento, più efficiente del DPO. Da utilizzare per l'allineamento delle preferenze quando si desidera una formazione più semplice e veloce rispetto a DPO/PPO. Fonte: ovachiever/droid-tings.

Come installo simpo-training?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/ovachiever/droid-tings --skill simpo-training Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/ovachiever/droid-tings