vllm-ascend

Name: vllm-ascend
Author: ascend-ai-coding

✓

ascend-ai-coding/awesome-ascend-skills

vLLM Ascend 插件，用于在华为 Ascend NPU 上提供 LLM 推理服务。用于离线批量推理、API 服务器部署、量化推理（使用 msmodelslim 量化模型）、分布式服务的张量/管道并行性以及与 OpenAI 兼容的 API 端点。支持具有 Ascend 优化内核的 Qwen、DeepSeek、GLM、LLaMA 模型。

ascend-ai-coding·vllm·ascend

15安装·1热度·@ascend-ai-coding

安装

$npx skills add https://github.com/ascend-ai-coding/awesome-ascend-skills --skill vllm-ascend

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-03-09

vllm-ascend

安装

如何安装 vllm-ascend

SKILL.md

可引用信息

快速解答

什么是 vllm-ascend？

如何安装 vllm-ascend？

这个 Skill 的源码在哪？

详情

相关 Skills