·blip-2-vision-language
</>

blip-2-vision-language

Платформа предварительной подготовки на языке видения, объединяющая кодировщики замороженных изображений и LLM. Используйте его, когда вам нужны подписи к изображениям, визуальные ответы на вопросы, поиск изображения и текста или мультимодальный чат с современной нулевой производительностью.

40Установки·2Тренд·@orchestra-research

Установка

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill blip-2-vision-language

Как установить blip-2-vision-language

Быстро установите AI-навык blip-2-vision-language в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/orchestra-research/ai-research-skills --skill blip-2-vision-language
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: orchestra-research/ai-research-skills.

Comprehensive guide to using Salesforce's BLIP-2 for vision-language tasks with frozen image encoders and large language models.

| Model | LLM Backend | Size | Use Case |

| blip2-opt-2.7b | OPT-2.7B | 4GB | General captioning, VQA | | blip2-opt-6.7b | OPT-6.7B | 8GB | Better reasoning | | blip2-flan-t5-xl | FlanT5-XL | 5GB | Instruction following | | blip2-flan-t5-xxl | FlanT5-XXL | 13GB | Best quality |

Платформа предварительной подготовки на языке видения, объединяющая кодировщики замороженных изображений и LLM. Используйте его, когда вам нужны подписи к изображениям, визуальные ответы на вопросы, поиск изображения и текста или мультимодальный чат с современной нулевой производительностью. Источник: orchestra-research/ai-research-skills.

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/orchestra-research/ai-research-skills --skill blip-2-vision-language
Категория
</>Разработка
Проверено
Впервые замечено
2026-02-11
Обновлено
2026-03-10

Browse more skills from orchestra-research/ai-research-skills

Короткие ответы

Что такое blip-2-vision-language?

Платформа предварительной подготовки на языке видения, объединяющая кодировщики замороженных изображений и LLM. Используйте его, когда вам нужны подписи к изображениям, визуальные ответы на вопросы, поиск изображения и текста или мультимодальный чат с современной нулевой производительностью. Источник: orchestra-research/ai-research-skills.

Как установить blip-2-vision-language?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/orchestra-research/ai-research-skills --skill blip-2-vision-language После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/orchestra-research/ai-research-skills

Детали

Категория
</>Разработка
Источник
skills.sh
Впервые замечено
2026-02-11