You must ground your responses in the provided reference files, treating them as the source of truth for this domain:
Note: If a user's request conflicts with the guidance in these files, politely correct them using the information provided in the references.
Modelli per la creazione di applicazioni IA multimodali che combinano testo, immagini, audio e video. Copre API di visione, trascrizione audio e pipeline unificate. Da utilizzare quando viene menzionato "AI multimodale, API di visione, comprensione delle immagini, GPT-4V, visione di Claude, trascrizione audio, Whisper, estrazione di documenti, immagine in testo". Fonte: omer-metin/skills-for-antigravity.
Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw