·grpo-rl-training

</>

grpo-rl-training

✓

orchestra-research/ai-research-skills

使用 TRL 进行 GRPO/RL 微调的专家指导，以进行推理和特定于任务的模型训练

orchestra-research·grpo·rl·training

16安装·1热度·@orchestra-research

安装

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill grpo-rl-training

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-11

相关 Skills

ml-paper-writing

serving-llms-vllm