·multimodal-models
</>

multimodal-models

eyadsibai/ltk

Utilícelo cuando "CLIP", "Whisper", "Stable Diffusion", "SDXL", "voz-to-text", "text-to-image", "generación de imágenes", "transcripción", "clasificación de disparo cero", "similitud imagen-texto", "inpainting", "ControlNet"

22Instalaciones·1Tendencia·@eyadsibai

Instalación

$npx skills add https://github.com/eyadsibai/ltk --skill multimodal-models

SKILL.md

| CLIP | Image + Text | Zero-shot classification, similarity | | Whisper | Audio → Text | Transcription, translation | | Stable Diffusion | Text → Image | Image generation, editing |

| Zero-shot classification | Compare image to text label embeddings | | Image search | Find images matching text query | | Content moderation | Classify against safety categories | | Image similarity | Compare image embeddings |

| ViT-B/32 | 151M | Recommended balance | | ViT-L/14 | 428M | Best quality, slower | | RN50 | 102M | Fastest, lower quality |

Utilícelo cuando "CLIP", "Whisper", "Stable Diffusion", "SDXL", "voz-to-text", "text-to-image", "generación de imágenes", "transcripción", "clasificación de disparo cero", "similitud imagen-texto", "inpainting", "ControlNet" Fuente: eyadsibai/ltk.

Ver original

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/eyadsibai/ltk --skill multimodal-models
Categoría
</>Desarrollo
Verificado
Primera vez visto
2026-02-17
Actualizado
2026-02-18

Respuestas rápidas

¿Qué es multimodal-models?

Utilícelo cuando "CLIP", "Whisper", "Stable Diffusion", "SDXL", "voz-to-text", "text-to-image", "generación de imágenes", "transcripción", "clasificación de disparo cero", "similitud imagen-texto", "inpainting", "ControlNet" Fuente: eyadsibai/ltk.

¿Cómo instalo multimodal-models?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/eyadsibai/ltk --skill multimodal-models Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor

¿Dónde está el repositorio de origen?

https://github.com/eyadsibai/ltk