simpo-training

Name: simpo-training
Author: ovachiever

✓

ovachiever/droid-tings

LLM アライメントのためのシンプルな設定の最適化。より優れたパフォーマンスを備えた DPO のリファレンスフリーの代替品 (AlpacaEval 2.0 で +6.4 ポイント)。参照モデルは必要なく、DPO よりも効率的です。 DPO/PPO よりもシンプルで高速なトレーニングが必要な場合に、好みの調整に使用します。

ovachiever·simpo·training

27インストール·0トレンド·@ovachiever

インストール

$npx skills add https://github.com/ovachiever/droid-tings --skill simpo-training

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-03-03

simpo-training

インストール

simpo-training のインストール方法

SKILL.md

引用可能な情報

クイックアンサー

simpo-training とは？

simpo-training のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills