什麼是 ais-bench?
AISBench Benchmark - Ascend NPU 的 AI 模型評估工具。支援準確性評估(文字、多模態資料集上的服務/本地模型)、效能評估(延遲、吞吐量、壓力測試、穩態、真實流量模擬)、vLLM/Triton 推理服務、15+ 基準測試(MMLU、GSM8K、MMMU、docvqa、ocrbench_v2 等)、多輪對話、GSM8K、MMMU、docvqa、ocrbench_v2 等)、多輪對話、函數 (BFCL) 和自定義資料集。 來源:ascend-ai-coding/awesome-ascend-skills。