model_finetuning

Name: model_finetuning
Author: vuralserhat86

✓

vuralserhat86/antigravity-agentic-skills

TRL による強化学習を使用して LLM を微調整します。命令調整には SFT、好みの調整には DPO、報酬の最適化には PPO/GRPO、報酬モデルのトレーニングに使用します。 RLHF が必要な場合に使用し、モデルを好みに合わせて調整するか、人間のフィードバックからトレーニングします。ハギングフェイストランスフォーマーと連携します。

vuralserhat86·model·finetuning

8インストール·0トレンド·@vuralserhat86

インストール

$npx skills add https://github.com/vuralserhat86/antigravity-agentic-skills --skill model_finetuning

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-01

model_finetuning

インストール

SKILL.md

引用可能な情報

クイックアンサー

model_finetuning とは？

model_finetuning のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills