·grpo-rl-training

</>

grpo-rl-training

✓

ovachiever/droid-tings

Conseils d'experts pour le réglage fin de GRPO/RL avec TRL pour le raisonnement et la formation de modèles spécifiques à des tâches

ovachiever·grpo·rl·training

21Installations·0Tendance·@ovachiever

Installation

$npx skills add https://github.com/ovachiever/droid-tings --skill grpo-rl-training

Détails

Catégorie: </>Développement
Source: skills.sh
Première apparition: 2026-02-01

Skills Connexes

security-auditor

140 Installations

nextjs-shadcn-builder

132 Installations

threejs-graphics-optimizer

53 Installations

deep-reading-analyst

47 Installations

tailwind-v4-shadcn

42 Installations

react-hook-form-zod

41 Installations