Qu'est-ce que onnx-webgpu-converter ?
Convertissez les modèles de transformateur HuggingFace au format ONNX pour l'inférence du navigateur avec Transformers.js et WebGPU. À utiliser lorsqu'on vous donne un lien de modèle HuggingFace pour convertir en ONNX, lors de la configuration d'optimum-cli pour l'exportation ONNX, lors de la quantification des modèles (fp16, q8, q4) pour le déploiement Web, lors de la configuration de Transformers.js avec l'accélération WebGPU ou lors du dépannage des erreurs de conversion ONNX. Se déclenche sur les mentions de conversion ONNX, Transformers.js, d'inférence WebGPU, d'exportation optimale, de quantification de modèle pour le navigateur ou d'exécution de modèles ML dans le navigateur. Source : jakerains/agentskills.