·grpo-rl-training

</>

grpo-rl-training

✓

orchestra-research/ai-research-skills

推論およびタスク固有のモデルトレーニングのための TRL を使用した GRPO/RL 微調整のための専門家によるガイダンス

orchestra-research·grpo·rl·training

16インストール·1トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill grpo-rl-training

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-11

関連 Skills

ml-paper-writing

42 インストール

19 インストール

19 インストール

18 インストール

serving-llms-vllm

18 インストール

18 インストール