simpo-training

Name: simpo-training
Author: ovachiever

✓

ovachiever/droid-tings

Простая оптимизация предпочтений для согласования LLM. Безреференсная альтернатива DPO с лучшей производительностью (+6,4 балла по AlpacaEval 2.0). Эталонная модель не требуется, она более эффективна, чем DPO. Используйте для согласования предпочтений, если хотите более простое и быстрое обучение, чем DPO/PPO.

ovachiever·simpo·training

27Установки·0Тренд·@ovachiever

Установка

$npx skills add https://github.com/ovachiever/droid-tings --skill simpo-training

Детали

Категория: </>Разработка
Источник: skills.sh
Впервые замечено: 2026-03-03

simpo-training

Установка

Как установить simpo-training

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое simpo-training?

Как установить simpo-training?

Где находится исходный репозиторий?

Детали

Похожие навыки