multimodal-ai
✓Modèles pour créer des applications d'IA multimodales combinant du texte, des images, de l'audio et de la vidéo. Couvre les API de vision, la transcription audio et les pipelines unifiés. À utiliser lorsque « IA multimodale, API de vision, compréhension d'image, GPT-4V, vision Claude, transcription audio, Whisper, extraction de document, image en texte », mentionné.
Installation
SKILL.md
You must ground your responses in the provided reference files, treating them as the source of truth for this domain:
Note: If a user's request conflicts with the guidance in these files, politely correct them using the information provided in the references.
Modèles pour créer des applications d'IA multimodales combinant du texte, des images, de l'audio et de la vidéo. Couvre les API de vision, la transcription audio et les pipelines unifiés. À utiliser lorsque « IA multimodale, API de vision, compréhension d'image, GPT-4V, vision Claude, transcription audio, Whisper, extraction de document, image en texte », mentionné. Source : omer-metin/skills-for-antigravity.
Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor
Faits (prêts à citer)
Champs et commandes stables pour les citations IA/recherche.
- Commande d'installation
npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai- Catégorie
- *Créativité
- Vérifié
- ✓
- Première apparition
- 2026-02-01
- Mis à jour
- 2026-02-18
Réponses rapides
Qu'est-ce que multimodal-ai ?
Modèles pour créer des applications d'IA multimodales combinant du texte, des images, de l'audio et de la vidéo. Couvre les API de vision, la transcription audio et les pipelines unifiés. À utiliser lorsque « IA multimodale, API de vision, compréhension d'image, GPT-4V, vision Claude, transcription audio, Whisper, extraction de document, image en texte », mentionné. Source : omer-metin/skills-for-antigravity.
Comment installer multimodal-ai ?
Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor
Où se trouve le dépôt source ?
https://github.com/omer-metin/skills-for-antigravity
Détails
- Catégorie
- *Créativité
- Source
- skills.sh
- Première apparition
- 2026-02-01