msmodelslim

Name: msmodelslim
Author: ascend-ai-coding

✓

ascend-ai-coding/awesome-ascend-skills

Huawei Ascend NPU model compression tool (msModelSlim). Use for LLM quantization (W4A8, W8A8, W8A8S, W8A16), MoE model compression, multimodal model compression (Qwen-VL, InternVL, HunyuanVideo, FLUX, SD3), calibration data preparation, precision auto-tuning, sensitive layer analysis, custom model integration, and deployment in MindIE/vLLM-Ascend. Supports Qwen, LLaMA, DeepSeek, GLM, Kimi, InternLM and more.

ascend-ai-coding·msmodelslim

24Installs·0Trend·@ascend-ai-coding