msmodelslim

Name: msmodelslim
Author: ascend-ai-coding

✓

ascend-ai-coding/awesome-ascend-skills

Strumento di compressione del modello Huawei Ascend NPU (msModelSlim). Utilizzare per la quantizzazione LLM (W4A8, W8A8, W8A8S, W8A16), compressione del modello MoE, compressione del modello multimodale (Qwen-VL, InternVL, HunyuanVideo, FLUX, SD3), preparazione dei dati di calibrazione, regolazione automatica di precisione, analisi dei livelli sensibili, integrazione del modello personalizzato e distribuzione in MindIE/vLLM-Ascend. Supporta Qwen, LLaMA, DeepSeek, GLM, Kimi, InternLM e altri.

ascend-ai-coding·msmodelslim

25Installazioni·1Tendenza·@ascend-ai-coding