Che cos'è onnx-webgpu-converter?
Converti i modelli di trasformatori HuggingFace nel formato ONNX per l'inferenza del browser con Transformers.js e WebGPU. Da utilizzare quando viene fornito un collegamento al modello HuggingFace per la conversione in ONNX, quando si configura Optimal-Cli per l'esportazione ONNX, quando si quantizzano i modelli (fp16, q8, q4) per la distribuzione Web, quando si configura Transformers.js con l'accelerazione WebGPU o quando si risolvono gli errori di conversione ONNX. Si attiva quando vengono menzionati la conversione ONNX, Transformers.js, l'inferenza WebGPU, l'esportazione ottimale, la quantizzazione del modello per il browser o l'esecuzione di modelli ML nel browser. Fonte: jakerains/agentskills.