·gemini-3-multimodal
#

gemini-3-multimodal

adaptationio/skrillz

Procese entradas multimodales (imágenes, videos, audio, archivos PDF) con Gemini 3 Pro. Cubre comprensión de imágenes, análisis de video, procesamiento de audio, extracción de documentos, control de resolución de medios, OCR y optimización de tokens. Úselo al analizar imágenes, procesar videos, transcribir audio, extraer contenido PDF o trabajar con datos multimodales.

16Instalaciones·0Tendencia·@adaptationio

Instalación

$npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal

SKILL.md

Comprehensive guide for processing multimodal inputs with Gemini 3 Pro, including image understanding, video analysis, audio processing, and PDF document extraction. This skill focuses on INPUT processing (analyzing media) - see gemini-3-image-generation for OUTPUT (generating images).

Gemini 3 Pro provides native multimodal capabilities for understanding and analyzing various media types. This skill covers all input processing operations with granular control over quality, performance, and token consumption.

| Resolution | Tokens per Image | Best For |

Procese entradas multimodales (imágenes, videos, audio, archivos PDF) con Gemini 3 Pro. Cubre comprensión de imágenes, análisis de video, procesamiento de audio, extracción de documentos, control de resolución de medios, OCR y optimización de tokens. Úselo al analizar imágenes, procesar videos, transcribir audio, extraer contenido PDF o trabajar con datos multimodales. Fuente: adaptationio/skrillz.

Ver original

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal
Categoría
#Documentos
Verificado
Primera vez visto
2026-02-01
Actualizado
2026-02-18

Respuestas rápidas

¿Qué es gemini-3-multimodal?

Procese entradas multimodales (imágenes, videos, audio, archivos PDF) con Gemini 3 Pro. Cubre comprensión de imágenes, análisis de video, procesamiento de audio, extracción de documentos, control de resolución de medios, OCR y optimización de tokens. Úselo al analizar imágenes, procesar videos, transcribir audio, extraer contenido PDF o trabajar con datos multimodales. Fuente: adaptationio/skrillz.

¿Cómo instalo gemini-3-multimodal?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor

¿Dónde está el repositorio de origen?

https://github.com/adaptationio/skrillz