كيف أثبّت simpo-training؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/ovachiever/droid-tings --skill simpo-training بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

·simpo-training

</>

simpo-training

Name: simpo-training
Author: ovachiever

✓

ovachiever/droid-tings

تحسين التفضيلات البسيطة لمحاذاة LLM. بديل خالٍ من المراجع لـ DPO مع أداء أفضل (+6.4 نقطة في AlpacaEval 2.0). لا حاجة إلى نموذج مرجعي، فهو أكثر كفاءة من DPO. يُستخدم لمحاذاة التفضيلات عندما تريد تدريبًا أبسط وأسرع من DPO/PPO.

ovachiever·simpo·training

27التثبيتات·0الرائج·@ovachiever