·grpo-rl-training

</>

grpo-rl-training

✓

orchestra-research/ai-research-skills

Orientación experta para el ajuste de GRPO/RL con TRL para el razonamiento y la capacitación de modelos de tareas específicas

orchestra-research·grpo·rl·training

16Instalaciones·1Tendencia·@orchestra-research

Instalación

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill grpo-rl-training

Detalles

Categoría: </>Desarrollo
Fuente: skills.sh
Primera vez visto: 2026-02-11

Skills Relacionados

ml-paper-writing

42 Instalaciones

19 Instalaciones

19 Instalaciones

18 Instalaciones

serving-llms-vllm

18 Instalaciones

18 Instalaciones