·grpo-rl-training

</>

grpo-rl-training

✓

ovachiever/droid-tings

추론 및 작업별 모델 교육을 위해 TRL을 사용한 GRPO/RL 미세 조정에 대한 전문가 지침

ovachiever·grpo·rl·training

21설치·0트렌드·@ovachiever

설치

$npx skills add https://github.com/ovachiever/droid-tings --skill grpo-rl-training

상세

카테고리: </>개발 도구
출처: skills.sh
최초 등록: 2026-02-01

관련 Skills

security-auditor

nextjs-shadcn-builder

threejs-graphics-optimizer

deep-reading-analyst

tailwind-v4-shadcn

react-hook-form-zod