gemini-3-multimodal
✓Procese entradas multimodales (imágenes, videos, audio, archivos PDF) con Gemini 3 Pro. Cubre comprensión de imágenes, análisis de video, procesamiento de audio, extracción de documentos, control de resolución de medios, OCR y optimización de tokens. Úselo al analizar imágenes, procesar videos, transcribir audio, extraer contenido PDF o trabajar con datos multimodales.
Instalación
SKILL.md
Comprehensive guide for processing multimodal inputs with Gemini 3 Pro, including image understanding, video analysis, audio processing, and PDF document extraction. This skill focuses on INPUT processing (analyzing media) - see gemini-3-image-generation for OUTPUT (generating images).
Gemini 3 Pro provides native multimodal capabilities for understanding and analyzing various media types. This skill covers all input processing operations with granular control over quality, performance, and token consumption.
| Resolution | Tokens per Image | Best For |
Procese entradas multimodales (imágenes, videos, audio, archivos PDF) con Gemini 3 Pro. Cubre comprensión de imágenes, análisis de video, procesamiento de audio, extracción de documentos, control de resolución de medios, OCR y optimización de tokens. Úselo al analizar imágenes, procesar videos, transcribir audio, extraer contenido PDF o trabajar con datos multimodales. Fuente: adaptationio/skrillz.
Datos (listos para citar)
Campos y comandos estables para citas de IA/búsqueda.
- Comando de instalación
npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal- Fuente
- adaptationio/skrillz
- Categoría
- #Documentos
- Verificado
- ✓
- Primera vez visto
- 2026-02-01
- Actualizado
- 2026-02-18
Respuestas rápidas
¿Qué es gemini-3-multimodal?
Procese entradas multimodales (imágenes, videos, audio, archivos PDF) con Gemini 3 Pro. Cubre comprensión de imágenes, análisis de video, procesamiento de audio, extracción de documentos, control de resolución de medios, OCR y optimización de tokens. Úselo al analizar imágenes, procesar videos, transcribir audio, extraer contenido PDF o trabajar con datos multimodales. Fuente: adaptationio/skrillz.
¿Cómo instalo gemini-3-multimodal?
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
¿Dónde está el repositorio de origen?
https://github.com/adaptationio/skrillz
Detalles
- Categoría
- #Documentos
- Fuente
- skills.sh
- Primera vez visto
- 2026-02-01