Che cos'è blip-2-vision-language?
Quadro di pre-formazione del linguaggio visivo che collega codificatori di immagini congelate e LLM. Utilizzalo quando hai bisogno di sottotitoli per immagini, risposte visive a domande, recupero di testo di immagini o chat multimodale con prestazioni zero-shot all'avanguardia. Fonte: orchestra-research/ai-research-skills.