什麼是 onnx-webgpu-converter?
將 HuggingFace 變壓器模型轉換為 ONNX 格式,以便使用 Transformers.js 和 WebGPU 進行瀏覽器推理。當給定 HuggingFace 模型連結以轉換為 ONNX 時、為 ONNX 匯出設定 optimization-cli 時、為 Web 部署量化模型(fp16、q8、q4)時、使用 WebGPU 加速設定 Transformers.js 或排除 ONNX 轉換錯誤時使用。當提及 ONNX 轉換、Transformers.js、WebGPU 推理、最佳匯出、瀏覽器模型量化或在瀏覽器中執行 ML 模型時觸發。 來源:jakerains/agentskills。