·slime-rl-training

{}

slime-rl-training

✓

orchestra-research/ai-research-skills

Megatron+SGLang 프레임워크인 slime을 사용하여 RL을 통한 LLM 사후 교육에 대한 지침을 제공합니다. GLM 모델을 훈련하거나, 맞춤형 데이터 생성 워크플로를 구현하거나, RL 확장을 위해 긴밀한 Megatron-LM 통합이 필요할 때 사용하세요.

orchestra-research·slime·rl·training

15설치·0트렌드·@orchestra-research

설치

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill slime-rl-training

상세

카테고리: {}데이터 분석
출처: skills.sh
최초 등록: 2026-02-11

관련 Skills

ml-paper-writing

serving-llms-vllm