·grpo-rl-training

</>

grpo-rl-training

✓

orchestra-research/ai-research-skills

使用 TRL 進行 GRPO/RL 微調的專家指導，以進行推理和特定於任務的模型訓練

orchestra-research·grpo·rl·training

16安裝·1熱度·@orchestra-research

安裝

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill grpo-rl-training

詳情

分類: </>開發工具
來源: skills.sh
收錄時間: 2026-02-11

相關 Skills

ml-paper-writing

serving-llms-vllm