gemini-3-multimodal
✓Traitez les entrées multimodales (images, vidéo, audio, PDF) avec Gemini 3 Pro. Couvre la compréhension des images, l'analyse vidéo, le traitement audio, l'extraction de documents, le contrôle de la résolution multimédia, l'OCR et l'optimisation des jetons. À utiliser pour analyser des images, traiter des vidéos, transcrire de l'audio, extraire du contenu PDF ou travailler avec des données multimodales.
Installation
SKILL.md
Comprehensive guide for processing multimodal inputs with Gemini 3 Pro, including image understanding, video analysis, audio processing, and PDF document extraction. This skill focuses on INPUT processing (analyzing media) - see gemini-3-image-generation for OUTPUT (generating images).
Gemini 3 Pro provides native multimodal capabilities for understanding and analyzing various media types. This skill covers all input processing operations with granular control over quality, performance, and token consumption.
| Resolution | Tokens per Image | Best For |
Traitez les entrées multimodales (images, vidéo, audio, PDF) avec Gemini 3 Pro. Couvre la compréhension des images, l'analyse vidéo, le traitement audio, l'extraction de documents, le contrôle de la résolution multimédia, l'OCR et l'optimisation des jetons. À utiliser pour analyser des images, traiter des vidéos, transcrire de l'audio, extraire du contenu PDF ou travailler avec des données multimodales. Source : adaptationio/skrillz.
Faits (prêts à citer)
Champs et commandes stables pour les citations IA/recherche.
- Commande d'installation
npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal- Source
- adaptationio/skrillz
- Catégorie
- #Documents
- Vérifié
- ✓
- Première apparition
- 2026-02-01
- Mis à jour
- 2026-02-18
Réponses rapides
Qu'est-ce que gemini-3-multimodal ?
Traitez les entrées multimodales (images, vidéo, audio, PDF) avec Gemini 3 Pro. Couvre la compréhension des images, l'analyse vidéo, le traitement audio, l'extraction de documents, le contrôle de la résolution multimédia, l'OCR et l'optimisation des jetons. À utiliser pour analyser des images, traiter des vidéos, transcrire de l'audio, extraire du contenu PDF ou travailler avec des données multimodales. Source : adaptationio/skrillz.
Comment installer gemini-3-multimodal ?
Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor
Où se trouve le dépôt source ?
https://github.com/adaptationio/skrillz
Détails
- Catégorie
- #Documents
- Source
- skills.sh
- Première apparition
- 2026-02-01