model-serving

Name: model-serving
Author: ancoleman

✓

用于推理的 LLM 和 ML 模型部署。在生产中提供模型、构建 AI API 或优化推理时使用。涵盖 vLLM（LLM 服务）、TensorRT-LLM（GPU 优化）、Ollama（本地）、BentoML（ML 部署）、Triton（多模型）、LangChain（编排）、LlamaIndex (RAG) 和流模式。

ancoleman·model·serving

7安装·0热度·@ancoleman

安装

$npx skills add https://github.com/ancoleman/ai-design-components --skill model-serving

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-01

model-serving

安装

SKILL.md

可引用信息

快速解答

什么是 model-serving？

如何安装 model-serving？

这个 Skill 的源码在哪？

详情

相关 Skills