model-serving

Name: model-serving
Author: ancoleman

✓

추론을 위한 LLM 및 ML 모델 배포. 프로덕션에서 모델을 제공하거나 AI API를 구축하거나 추론을 최적화할 때 사용하세요. vLLM(LLM 제공), TensorRT-LLM(GPU 최적화), Ollama(로컬), BentoML(ML 배포), Triton(다중 모델), LangChain(오케스트레이션), LlamaIndex(RAG) 및 스트리밍 패턴을 다룹니다.

ancoleman·model·serving

7설치·0트렌드·@ancoleman

설치

$npx skills add https://github.com/ancoleman/ai-design-components --skill model-serving

상세

카테고리: </>개발 도구
출처: skills.sh
최초 등록: 2026-02-01

model-serving

설치

SKILL.md

인용 가능한 정보

빠른 답변

model-serving이란?

model-serving 설치 방법은?

소스 저장소는 어디인가요?

상세

관련 Skills