vllm-ascend

Name: vllm-ascend
Author: ascend-ai-coding

✓

ascend-ai-coding/awesome-ascend-skills

vLLM Ascend-Plugin für die Bereitstellung von LLM-Inferenzen auf der Huawei Ascend NPU. Verwendung für Offline-Batch-Inferenz, API-Serverbereitstellung, Quantisierungsinferenz (mit quantisierten msmodelslim-Modellen), Tensor-/Pipeline-Parallelität für verteilte Bereitstellung und OpenAI-kompatible API-Endpunkte. Unterstützt Qwen-, DeepSeek-, GLM- und LLaMA-Modelle mit Ascend-optimierten Kerneln.

ascend-ai-coding·vllm·ascend

15Installationen·1Trend·@ascend-ai-coding

Installation

$npx skills add https://github.com/ascend-ai-coding/awesome-ascend-skills --skill vllm-ascend

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-03-09

vllm-ascend

Installation

So installieren Sie vllm-ascend

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist vllm-ascend?

Wie installiere ich vllm-ascend?

Wo ist das Quell-Repository?

Details

Verwandte Skills