gemini-3-multimodal
✓Verarbeiten Sie multimodale Eingaben (Bilder, Video, Audio, PDFs) mit Gemini 3 Pro. Umfasst Bildverständnis, Videoanalyse, Audioverarbeitung, Dokumentenextraktion, Steuerung der Medienauflösung, OCR und Token-Optimierung. Verwenden Sie es, wenn Sie Bilder analysieren, Videos verarbeiten, Audio transkribieren, PDF-Inhalte extrahieren oder mit multimodalen Daten arbeiten.
Installation
SKILL.md
Comprehensive guide for processing multimodal inputs with Gemini 3 Pro, including image understanding, video analysis, audio processing, and PDF document extraction. This skill focuses on INPUT processing (analyzing media) - see gemini-3-image-generation for OUTPUT (generating images).
Gemini 3 Pro provides native multimodal capabilities for understanding and analyzing various media types. This skill covers all input processing operations with granular control over quality, performance, and token consumption.
| Resolution | Tokens per Image | Best For |
Verarbeiten Sie multimodale Eingaben (Bilder, Video, Audio, PDFs) mit Gemini 3 Pro. Umfasst Bildverständnis, Videoanalyse, Audioverarbeitung, Dokumentenextraktion, Steuerung der Medienauflösung, OCR und Token-Optimierung. Verwenden Sie es, wenn Sie Bilder analysieren, Videos verarbeiten, Audio transkribieren, PDF-Inhalte extrahieren oder mit multimodalen Daten arbeiten. Quelle: adaptationio/skrillz.
Fakten (zitierbereit)
Stabile Felder und Befehle für KI/Such-Zitate.
- Installationsbefehl
npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal- Quelle
- adaptationio/skrillz
- Kategorie
- #Dokumente
- Verifiziert
- ✓
- Erstes Auftreten
- 2026-02-01
- Aktualisiert
- 2026-02-18
Schnelle Antworten
Was ist gemini-3-multimodal?
Verarbeiten Sie multimodale Eingaben (Bilder, Video, Audio, PDFs) mit Gemini 3 Pro. Umfasst Bildverständnis, Videoanalyse, Audioverarbeitung, Dokumentenextraktion, Steuerung der Medienauflösung, OCR und Token-Optimierung. Verwenden Sie es, wenn Sie Bilder analysieren, Videos verarbeiten, Audio transkribieren, PDF-Inhalte extrahieren oder mit multimodalen Daten arbeiten. Quelle: adaptationio/skrillz.
Wie installiere ich gemini-3-multimodal?
Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor
Wo ist das Quell-Repository?
https://github.com/adaptationio/skrillz
Details
- Kategorie
- #Dokumente
- Quelle
- skills.sh
- Erstes Auftreten
- 2026-02-01