·multimodal-ai
*

multimodal-ai

omer-metin/skills-for-antigravity

Muster zum Erstellen multimodaler KI-Anwendungen, die Text, Bilder, Audio und Video kombinieren. Behandelt Vision-APIs, Audiotranskription und einheitliche Pipelines. Verwenden Sie, wenn „multimodale KI, Vision-API, Bildverständnis, GPT-4V, Claude Vision, Audiotranskription, Whisper, Dokumentenextraktion, Bild-zu-Text“ erwähnt wird.

9Installationen·0Trend·@omer-metin

Installation

$npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai

SKILL.md

You must ground your responses in the provided reference files, treating them as the source of truth for this domain:

Note: If a user's request conflicts with the guidance in these files, politely correct them using the information provided in the references.

Muster zum Erstellen multimodaler KI-Anwendungen, die Text, Bilder, Audio und Video kombinieren. Behandelt Vision-APIs, Audiotranskription und einheitliche Pipelines. Verwenden Sie, wenn „multimodale KI, Vision-API, Bildverständnis, GPT-4V, Claude Vision, Audiotranskription, Whisper, Dokumentenextraktion, Bild-zu-Text“ erwähnt wird. Quelle: omer-metin/skills-for-antigravity.

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Original anzeigen

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai
Kategorie
*Kreativität
Verifiziert
Erstes Auftreten
2026-02-01
Aktualisiert
2026-02-18

Schnelle Antworten

Was ist multimodal-ai?

Muster zum Erstellen multimodaler KI-Anwendungen, die Text, Bilder, Audio und Video kombinieren. Behandelt Vision-APIs, Audiotranskription und einheitliche Pipelines. Verwenden Sie, wenn „multimodale KI, Vision-API, Bildverständnis, GPT-4V, Claude Vision, Audiotranskription, Whisper, Dokumentenextraktion, Bild-zu-Text“ erwähnt wird. Quelle: omer-metin/skills-for-antigravity.

Wie installiere ich multimodal-ai?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Wo ist das Quell-Repository?

https://github.com/omer-metin/skills-for-antigravity