msmodelslim

Name: msmodelslim
Author: ascend-ai-coding

✓

ascend-ai-coding/awesome-ascend-skills

Outil de compression de modèle Huawei Ascend NPU (msModelSlim). Utilisation pour la quantification LLM (W4A8, W8A8, W8A8S, W8A16), la compression de modèle MoE, la compression de modèle multimodal (Qwen-VL, InternVL, HunyuanVideo, FLUX, SD3), la préparation des données d'étalonnage, le réglage automatique de précision, l'analyse des couches sensibles, l'intégration de modèles personnalisés et le déploiement dans MindIE/vLLM-Ascend. Prend en charge Qwen, LLaMA, DeepSeek, GLM, Kimi, InternLM et plus encore.

ascend-ai-coding·msmodelslim

24Installations·0Tendance·@ascend-ai-coding