slime-user

Name: slime-user
Author: yzlnew

✓

SLIME(RL Scaling을 위한 LLM 사후 학습 프레임워크) 사용 가이드입니다. 설정, 구성, 교육 실행, 다중 회전 상호 작용, 사용자 정의 보상 모델, 도구 호출 시나리오 또는 SLIME 워크플로 문제 해결을 포함하여 언어 모델의 강화 학습 교육을 위해 SLIME을 사용할 때 사용합니다. GRPO, GSPO, PPO, Reinforce++, 다중 에이전트 RL, VLM 교육, FSDP/Megatron 백엔드, SGLang 통합, 동적 샘플링 및 사용자 정의 생성 기능을 다룹니다.

yzlnew·slime·user

5설치·0트렌드·@yzlnew

설치

$npx skills add https://github.com/yzlnew/infra-skills --skill slime-user

상세

카테고리: </>개발 도구
출처: skills.sh
최초 등록: 2026-02-01

slime-user

설치

SKILL.md

인용 가능한 정보

빠른 답변

slime-user이란?

slime-user 설치 방법은?

소스 저장소는 어디인가요?

상세

관련 Skills