·grpo-rl-training

</>

grpo-rl-training

✓

ovachiever/droid-tings

使用 TRL 進行 GRPO/RL 微調的專家指導，以進行推理和特定於任務的模型訓練

ovachiever·grpo·rl·training

21安裝·0熱度·@ovachiever

安裝

$npx skills add https://github.com/ovachiever/droid-tings --skill grpo-rl-training

詳情

分類: </>開發工具
來源: skills.sh
收錄時間: 2026-02-01

相關 Skills

security-auditor

nextjs-shadcn-builder

threejs-graphics-optimizer

deep-reading-analyst

tailwind-v4-shadcn

react-hook-form-zod