Что такое blip-2-vision-language?
Платформа предварительной подготовки на языке видения, объединяющая кодировщики замороженных изображений и LLM. Используйте его, когда вам нужны подписи к изображениям, визуальные ответы на вопросы, поиск изображения и текста или мультимодальный чат с современной нулевой производительностью. Источник: orchestra-research/ai-research-skills.