·multimodal-models
</>

multimodal-models

Используйте, когда «CLIP», «Шепот», «Стабильная диффузия», «SDXL», «преобразование речи в текст», «преобразование текста в изображение», «генерация изображения», «транскрипция», «классификация с нулевым кадром», «сходство изображения и текста», «зарисовка», «ControlNet».

31Установки·3Тренд·@eyadsibai

Установка

$npx skills add https://github.com/eyadsibai/ltk --skill multimodal-models

Как установить multimodal-models

Быстро установите AI-навык multimodal-models в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/eyadsibai/ltk --skill multimodal-models
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: eyadsibai/ltk.

| CLIP | Image + Text | Zero-shot classification, similarity | | Whisper | Audio → Text | Transcription, translation | | Stable Diffusion | Text → Image | Image generation, editing |

| Zero-shot classification | Compare image to text label embeddings | | Image search | Find images matching text query | | Content moderation | Classify against safety categories | | Image similarity | Compare image embeddings |

| ViT-B/32 | 151M | Recommended balance | | ViT-L/14 | 428M | Best quality, slower | | RN50 | 102M | Fastest, lower quality |

Используйте, когда «CLIP», «Шепот», «Стабильная диффузия», «SDXL», «преобразование речи в текст», «преобразование текста в изображение», «генерация изображения», «транскрипция», «классификация с нулевым кадром», «сходство изображения и текста», «зарисовка», «ControlNet». Источник: eyadsibai/ltk.

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/eyadsibai/ltk --skill multimodal-models
Источник
eyadsibai/ltk
Категория
</>Разработка
Проверено
Впервые замечено
2026-02-17
Обновлено
2026-03-10

Browse more skills from eyadsibai/ltk

Короткие ответы

Что такое multimodal-models?

Используйте, когда «CLIP», «Шепот», «Стабильная диффузия», «SDXL», «преобразование речи в текст», «преобразование текста в изображение», «генерация изображения», «транскрипция», «классификация с нулевым кадром», «сходство изображения и текста», «зарисовка», «ControlNet». Источник: eyadsibai/ltk.

Как установить multimodal-models?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/eyadsibai/ltk --skill multimodal-models После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/eyadsibai/ltk

Детали

Категория
</>Разработка
Источник
skills.sh
Впервые замечено
2026-02-17