multimodal-ai
✓Patrones para crear aplicaciones de IA multimodales que combinen texto, imágenes, audio y vídeo. Cubre API de visión, transcripción de audio y canalizaciones unificadas. Úselo cuando se mencione "IA multimodal, API de visión, comprensión de imágenes, GPT-4V, visión de Claude, transcripción de audio, Whisper, extracción de documentos, imagen a texto".
Instalación
SKILL.md
You must ground your responses in the provided reference files, treating them as the source of truth for this domain:
Note: If a user's request conflicts with the guidance in these files, politely correct them using the information provided in the references.
Patrones para crear aplicaciones de IA multimodales que combinen texto, imágenes, audio y vídeo. Cubre API de visión, transcripción de audio y canalizaciones unificadas. Úselo cuando se mencione "IA multimodal, API de visión, comprensión de imágenes, GPT-4V, visión de Claude, transcripción de audio, Whisper, extracción de documentos, imagen a texto". Fuente: omer-metin/skills-for-antigravity.
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
Datos (listos para citar)
Campos y comandos estables para citas de IA/búsqueda.
- Comando de instalación
npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai- Categoría
- *Creatividad
- Verificado
- ✓
- Primera vez visto
- 2026-02-01
- Actualizado
- 2026-02-18
Respuestas rápidas
¿Qué es multimodal-ai?
Patrones para crear aplicaciones de IA multimodales que combinen texto, imágenes, audio y vídeo. Cubre API de visión, transcripción de audio y canalizaciones unificadas. Úselo cuando se mencione "IA multimodal, API de visión, comprensión de imágenes, GPT-4V, visión de Claude, transcripción de audio, Whisper, extracción de documentos, imagen a texto". Fuente: omer-metin/skills-for-antigravity.
¿Cómo instalo multimodal-ai?
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
¿Dónde está el repositorio de origen?
https://github.com/omer-metin/skills-for-antigravity
Detalles
- Categoría
- *Creatividad
- Fuente
- skills.sh
- Primera vez visto
- 2026-02-01