simpo-training

Name: simpo-training
Author: ovachiever

✓

ovachiever/droid-tings

Einfache Präferenzoptimierung für die LLM-Ausrichtung. Referenzfreie Alternative zu DPO mit besserer Leistung (+6,4 Punkte bei AlpacaEval 2.0). Kein Referenzmodell erforderlich, effizienter als DPO. Verwenden Sie diese Option zur Präferenzausrichtung, wenn Sie ein einfacheres und schnelleres Training als DPO/PPO wünschen.

ovachiever·simpo·training

27Installationen·0Trend·@ovachiever

Installation

$npx skills add https://github.com/ovachiever/droid-tings --skill simpo-training

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-03-03

simpo-training

Installation

So installieren Sie simpo-training

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist simpo-training?

Wie installiere ich simpo-training?

Wo ist das Quell-Repository?

Details

Verwandte Skills