ما هي vllm-ascend؟
البرنامج المساعد vLLM Ascend لاستدلال LLM الذي يعمل على Huawei Ascend NPU. يستخدم للاستدلال الدفعي دون اتصال، ونشر خادم واجهة برمجة التطبيقات، واستدلال القياس الكمي (مع النماذج الكمية msmodelslim)، وتوازي الموتر/خط الأنابيب للخدمة الموزعة، ونقاط نهاية واجهة برمجة التطبيقات المتوافقة مع OpenAI. يدعم نماذج Qwen وDeepSeek وGLM وLLaMA مع حبات محسنة تصاعديًا. المصدر: ascend-ai-coding/awesome-ascend-skills.