model_finetuning

Name: model_finetuning
Author: vuralserhat86

✓

vuralserhat86/antigravity-agentic-skills

Optimieren Sie LLMs mithilfe von Reinforcement Learning mit TRL – SFT zur Anweisungsoptimierung, DPO zur Präferenzausrichtung, PPO/GRPO zur Belohnungsoptimierung und Belohnungsmodelltraining. Verwenden Sie bei Bedarf RLHF, richten Sie das Modell an Präferenzen aus oder trainieren Sie anhand von menschlichem Feedback. Funktioniert mit HuggingFace Transformers.

vuralserhat86·model·finetuning

8Installationen·0Trend·@vuralserhat86

Installation

$npx skills add https://github.com/vuralserhat86/antigravity-agentic-skills --skill model_finetuning

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-01

model_finetuning

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist model_finetuning?

Wie installiere ich model_finetuning?

Wo ist das Quell-Repository?

Details

Verwandte Skills