·slime-user
</>

slime-user

yzlnew/infra-skills

SLIME(RL Scaling을 위한 LLM 사후 학습 프레임워크) 사용 가이드입니다. 설정, 구성, 교육 실행, 다중 회전 상호 작용, 사용자 정의 보상 모델, 도구 호출 시나리오 또는 SLIME 워크플로 문제 해결을 포함하여 언어 모델의 강화 학습 교육을 위해 SLIME을 사용할 때 사용합니다. GRPO, GSPO, PPO, Reinforce++, 다중 에이전트 RL, VLM 교육, FSDP/Megatron 백엔드, SGLang 통합, 동적 샘플링 및 사용자 정의 생성 기능을 다룹니다.

5설치·0트렌드·@yzlnew

설치

$npx skills add https://github.com/yzlnew/infra-skills --skill slime-user

SKILL.md

SLIME is an LLM post-training framework for RL Scaling developed by THUDM. It supports various RL algorithms (GRPO, GSPO, PPO, Reinforce++), multiple training backends (Megatron, FSDP), and advanced features like multi-turn interactions, tool calling, and dynamic sampling.

SLIME has extensive documentation. Use this guide to find what you need quickly.

For detailed navigation of all documentation, see references/docnavigation.md.

SLIME(RL Scaling을 위한 LLM 사후 학습 프레임워크) 사용 가이드입니다. 설정, 구성, 교육 실행, 다중 회전 상호 작용, 사용자 정의 보상 모델, 도구 호출 시나리오 또는 SLIME 워크플로 문제 해결을 포함하여 언어 모델의 강화 학습 교육을 위해 SLIME을 사용할 때 사용합니다. GRPO, GSPO, PPO, Reinforce++, 다중 에이전트 RL, VLM 교육, FSDP/Megatron 백엔드, SGLang 통합, 동적 샘플링 및 사용자 정의 생성 기능을 다룹니다. 출처: yzlnew/infra-skills.

원본 보기

인용 가능한 정보

AI/검색 인용용 안정적인 필드와 명령어.

설치 명령어
npx skills add https://github.com/yzlnew/infra-skills --skill slime-user
카테고리
</>개발 도구
인증됨
최초 등록
2026-02-01
업데이트
2026-02-18

빠른 답변

slime-user이란?

SLIME(RL Scaling을 위한 LLM 사후 학습 프레임워크) 사용 가이드입니다. 설정, 구성, 교육 실행, 다중 회전 상호 작용, 사용자 정의 보상 모델, 도구 호출 시나리오 또는 SLIME 워크플로 문제 해결을 포함하여 언어 모델의 강화 학습 교육을 위해 SLIME을 사용할 때 사용합니다. GRPO, GSPO, PPO, Reinforce++, 다중 에이전트 RL, VLM 교육, FSDP/Megatron 백엔드, SGLang 통합, 동적 샘플링 및 사용자 정의 생성 기능을 다룹니다. 출처: yzlnew/infra-skills.

slime-user 설치 방법은?

터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/yzlnew/infra-skills --skill slime-user 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다

소스 저장소는 어디인가요?

https://github.com/yzlnew/infra-skills

상세

카테고리
</>개발 도구
출처
skills.sh
최초 등록
2026-02-01