model_finetuning

Name: model_finetuning
Author: vuralserhat86

Что такое model_finetuning?

Точная настройка LLM с помощью обучения с подкреплением с помощью TRL — SFT для настройки инструкций, DPO для согласования предпочтений, PPO/GRPO для оптимизации вознаграждения и обучения модели вознаграждения. Используйте, когда необходимо RLHF, согласуйте модель с предпочтениями или тренируйтесь на основе отзывов людей. Работает с трансформерами HuggingFace. Источник: vuralserhat86/antigravity-agentic-skills.

Как установить model_finetuning?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/vuralserhat86/antigravity-agentic-skills --skill model_finetuning После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/vuralserhat86/antigravity-agentic-skills

Установка

Детали

Похожие навыки

model_finetuning

Установка

Как установить model_finetuning

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое model_finetuning?

Как установить model_finetuning?

Где находится исходный репозиторий?

Детали

Похожие навыки