·gemini-3-multimodal
#

gemini-3-multimodal

Elabora input multimodali (immagini, video, audio, PDF) con Gemini 3 Pro. Copre la comprensione delle immagini, l'analisi video, l'elaborazione audio, l'estrazione dei documenti, il controllo della risoluzione multimediale, l'OCR e l'ottimizzazione dei token. Da utilizzare durante l'analisi di immagini, l'elaborazione di video, la trascrizione di audio, l'estrazione di contenuti PDF o l'utilizzo di dati multimodali.

27Installazioni·1Tendenza·@adaptationio

Installazione

$npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal

Come installare gemini-3-multimodal

Installa rapidamente la skill AI gemini-3-multimodal nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: adaptationio/skrillz.

Comprehensive guide for processing multimodal inputs with Gemini 3 Pro, including image understanding, video analysis, audio processing, and PDF document extraction. This skill focuses on INPUT processing (analyzing media) - see gemini-3-image-generation for OUTPUT (generating images).

Gemini 3 Pro provides native multimodal capabilities for understanding and analyzing various media types. This skill covers all input processing operations with granular control over quality, performance, and token consumption.

| Resolution | Tokens per Image | Best For |

Elabora input multimodali (immagini, video, audio, PDF) con Gemini 3 Pro. Copre la comprensione delle immagini, l'analisi video, l'elaborazione audio, l'estrazione dei documenti, il controllo della risoluzione multimediale, l'OCR e l'ottimizzazione dei token. Da utilizzare durante l'analisi di immagini, l'elaborazione di video, la trascrizione di audio, l'estrazione di contenuti PDF o l'utilizzo di dati multimodali. Fonte: adaptationio/skrillz.

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal
Categoria
#Documenti
Verificato
Prima apparizione
2026-02-01
Aggiornato
2026-03-10

Browse more skills from adaptationio/skrillz

Risposte rapide

Che cos'è gemini-3-multimodal?

Elabora input multimodali (immagini, video, audio, PDF) con Gemini 3 Pro. Copre la comprensione delle immagini, l'analisi video, l'elaborazione audio, l'estrazione dei documenti, il controllo della risoluzione multimediale, l'OCR e l'ottimizzazione dei token. Da utilizzare durante l'analisi di immagini, l'elaborazione di video, la trascrizione di audio, l'estrazione di contenuti PDF o l'utilizzo di dati multimodali. Fonte: adaptationio/skrillz.

Come installo gemini-3-multimodal?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/adaptationio/skrillz