·gemini-3-multimodal
#

gemini-3-multimodal

adaptationio/skrillz

Verarbeiten Sie multimodale Eingaben (Bilder, Video, Audio, PDFs) mit Gemini 3 Pro. Umfasst Bildverständnis, Videoanalyse, Audioverarbeitung, Dokumentenextraktion, Steuerung der Medienauflösung, OCR und Token-Optimierung. Verwenden Sie es, wenn Sie Bilder analysieren, Videos verarbeiten, Audio transkribieren, PDF-Inhalte extrahieren oder mit multimodalen Daten arbeiten.

16Installationen·0Trend·@adaptationio

Installation

$npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal

SKILL.md

Comprehensive guide for processing multimodal inputs with Gemini 3 Pro, including image understanding, video analysis, audio processing, and PDF document extraction. This skill focuses on INPUT processing (analyzing media) - see gemini-3-image-generation for OUTPUT (generating images).

Gemini 3 Pro provides native multimodal capabilities for understanding and analyzing various media types. This skill covers all input processing operations with granular control over quality, performance, and token consumption.

| Resolution | Tokens per Image | Best For |

Verarbeiten Sie multimodale Eingaben (Bilder, Video, Audio, PDFs) mit Gemini 3 Pro. Umfasst Bildverständnis, Videoanalyse, Audioverarbeitung, Dokumentenextraktion, Steuerung der Medienauflösung, OCR und Token-Optimierung. Verwenden Sie es, wenn Sie Bilder analysieren, Videos verarbeiten, Audio transkribieren, PDF-Inhalte extrahieren oder mit multimodalen Daten arbeiten. Quelle: adaptationio/skrillz.

Original anzeigen

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal
Kategorie
#Dokumente
Verifiziert
Erstes Auftreten
2026-02-01
Aktualisiert
2026-02-18

Schnelle Antworten

Was ist gemini-3-multimodal?

Verarbeiten Sie multimodale Eingaben (Bilder, Video, Audio, PDFs) mit Gemini 3 Pro. Umfasst Bildverständnis, Videoanalyse, Audioverarbeitung, Dokumentenextraktion, Steuerung der Medienauflösung, OCR und Token-Optimierung. Verwenden Sie es, wenn Sie Bilder analysieren, Videos verarbeiten, Audio transkribieren, PDF-Inhalte extrahieren oder mit multimodalen Daten arbeiten. Quelle: adaptationio/skrillz.

Wie installiere ich gemini-3-multimodal?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Wo ist das Quell-Repository?

https://github.com/adaptationio/skrillz