vllm-ascend

Name: vllm-ascend
Author: ascend-ai-coding

✓

ascend-ai-coding/awesome-ascend-skills

Complemento vLLM Ascend para servicio de inferencia LLM en Huawei Ascend NPU. Úselo para inferencia por lotes fuera de línea, implementación de servidor API, inferencia de cuantificación (con modelos cuantificados msmodelslim), paralelismo de tensor/canalización para servicio distribuido y puntos finales de API compatibles con OpenAI. Admite modelos Qwen, DeepSeek, GLM, LLaMA con kernels optimizados para Ascend.

ascend-ai-coding·vllm·ascend

15Instalaciones·1Tendencia·@ascend-ai-coding