·grpo-rl-training

</>

grpo-rl-training

✓

orchestra-research/ai-research-skills

Fachkundige Anleitung zur GRPO/RL-Feinabstimmung mit TRL für Argumentation und aufgabenspezifisches Modelltraining

orchestra-research·grpo·rl·training

15Installationen·0Trend·@orchestra-research

Installation

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill grpo-rl-training

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-11

Verwandte Skills

ml-paper-writing

41 Installationen

18 Installationen

18 Installationen

17 Installationen

serving-llms-vllm

17 Installationen

17 Installationen