Was ist msmodelslim?
Huawei Ascend NPU-Modellkomprimierungstool (msModelSlim). Verwendung für LLM-Quantisierung (W4A8, W8A8, W8A8S, W8A16), MoE-Modellkomprimierung, multimodale Modellkomprimierung (Qwen-VL, InternVL, HunyuanVideo, FLUX, SD3), Kalibrierungsdatenvorbereitung, präzises Auto-Tuning, Analyse sensibler Schichten, benutzerdefinierte Modellintegration und Bereitstellung in MindIE/vLLM-Ascend. Unterstützt Qwen, LLaMA, DeepSeek, GLM, Kimi, InternLM und mehr. Quelle: ascend-ai-coding/awesome-ascend-skills.