·multimodal-ai
*

multimodal-ai

omer-metin/skills-for-antigravity

Patrones para crear aplicaciones de IA multimodales que combinen texto, imágenes, audio y vídeo. Cubre API de visión, transcripción de audio y canalizaciones unificadas. Úselo cuando se mencione "IA multimodal, API de visión, comprensión de imágenes, GPT-4V, visión de Claude, transcripción de audio, Whisper, extracción de documentos, imagen a texto".

9Instalaciones·0Tendencia·@omer-metin

Instalación

$npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai

SKILL.md

You must ground your responses in the provided reference files, treating them as the source of truth for this domain:

Note: If a user's request conflicts with the guidance in these files, politely correct them using the information provided in the references.

Patrones para crear aplicaciones de IA multimodales que combinen texto, imágenes, audio y vídeo. Cubre API de visión, transcripción de audio y canalizaciones unificadas. Úselo cuando se mencione "IA multimodal, API de visión, comprensión de imágenes, GPT-4V, visión de Claude, transcripción de audio, Whisper, extracción de documentos, imagen a texto". Fuente: omer-metin/skills-for-antigravity.

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor

Ver original

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai
Categoría
*Creatividad
Verificado
Primera vez visto
2026-02-01
Actualizado
2026-02-18

Respuestas rápidas

¿Qué es multimodal-ai?

Patrones para crear aplicaciones de IA multimodales que combinen texto, imágenes, audio y vídeo. Cubre API de visión, transcripción de audio y canalizaciones unificadas. Úselo cuando se mencione "IA multimodal, API de visión, comprensión de imágenes, GPT-4V, visión de Claude, transcripción de audio, Whisper, extracción de documentos, imagen a texto". Fuente: omer-metin/skills-for-antigravity.

¿Cómo instalo multimodal-ai?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor

¿Dónde está el repositorio de origen?

https://github.com/omer-metin/skills-for-antigravity