·multimodal-models
</>

multimodal-models

eyadsibai/ltk

Verwendung bei „CLIP“, „Whisper“, „Stable Diffusion“, „SDXL“, „Speech-to-Text“, „Text-to-Image“, „Bildgenerierung“, „Transkription“, „Zero-Shot-Klassifizierung“, „Bild-Text-Ähnlichkeit“, „Inpainting“, „ControlNet“

22Installationen·1Trend·@eyadsibai

Installation

$npx skills add https://github.com/eyadsibai/ltk --skill multimodal-models

SKILL.md

| CLIP | Image + Text | Zero-shot classification, similarity | | Whisper | Audio → Text | Transcription, translation | | Stable Diffusion | Text → Image | Image generation, editing |

| Zero-shot classification | Compare image to text label embeddings | | Image search | Find images matching text query | | Content moderation | Classify against safety categories | | Image similarity | Compare image embeddings |

| ViT-B/32 | 151M | Recommended balance | | ViT-L/14 | 428M | Best quality, slower | | RN50 | 102M | Fastest, lower quality |

Verwendung bei „CLIP“, „Whisper“, „Stable Diffusion“, „SDXL“, „Speech-to-Text“, „Text-to-Image“, „Bildgenerierung“, „Transkription“, „Zero-Shot-Klassifizierung“, „Bild-Text-Ähnlichkeit“, „Inpainting“, „ControlNet“ Quelle: eyadsibai/ltk.

Original anzeigen

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/eyadsibai/ltk --skill multimodal-models
Kategorie
</>Entwicklung
Verifiziert
Erstes Auftreten
2026-02-17
Aktualisiert
2026-02-18

Schnelle Antworten

Was ist multimodal-models?

Verwendung bei „CLIP“, „Whisper“, „Stable Diffusion“, „SDXL“, „Speech-to-Text“, „Text-to-Image“, „Bildgenerierung“, „Transkription“, „Zero-Shot-Klassifizierung“, „Bild-Text-Ähnlichkeit“, „Inpainting“, „ControlNet“ Quelle: eyadsibai/ltk.

Wie installiere ich multimodal-models?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/eyadsibai/ltk --skill multimodal-models Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Wo ist das Quell-Repository?

https://github.com/eyadsibai/ltk