Che cos'è clip?
Il modello di OpenAI che connette visione e linguaggio. Consente la classificazione delle immagini zero-shot, la corrispondenza immagine-testo e il recupero intermodale. Addestrato su 400 milioni di coppie immagine-testo. Utilizzare per la ricerca di immagini, la moderazione dei contenuti o attività di linguaggio visivo senza regolazione fine. Ideale per la comprensione delle immagini per scopi generici. Fonte: ovachiever/droid-tings.