·multimodal-ai
*

multimodal-ai

omer-metin/skills-for-antigravity

Modèles pour créer des applications d'IA multimodales combinant du texte, des images, de l'audio et de la vidéo. Couvre les API de vision, la transcription audio et les pipelines unifiés. À utiliser lorsque « IA multimodale, API de vision, compréhension d'image, GPT-4V, vision Claude, transcription audio, Whisper, extraction de document, image en texte », mentionné.

9Installations·0Tendance·@omer-metin

Installation

$npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai

SKILL.md

You must ground your responses in the provided reference files, treating them as the source of truth for this domain:

Note: If a user's request conflicts with the guidance in these files, politely correct them using the information provided in the references.

Modèles pour créer des applications d'IA multimodales combinant du texte, des images, de l'audio et de la vidéo. Couvre les API de vision, la transcription audio et les pipelines unifiés. À utiliser lorsque « IA multimodale, API de vision, compréhension d'image, GPT-4V, vision Claude, transcription audio, Whisper, extraction de document, image en texte », mentionné. Source : omer-metin/skills-for-antigravity.

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor

Voir l'original

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai
Catégorie
*Créativité
Vérifié
Première apparition
2026-02-01
Mis à jour
2026-02-18

Réponses rapides

Qu'est-ce que multimodal-ai ?

Modèles pour créer des applications d'IA multimodales combinant du texte, des images, de l'audio et de la vidéo. Couvre les API de vision, la transcription audio et les pipelines unifiés. À utiliser lorsque « IA multimodale, API de vision, compréhension d'image, GPT-4V, vision Claude, transcription audio, Whisper, extraction de document, image en texte », mentionné. Source : omer-metin/skills-for-antigravity.

Comment installer multimodal-ai ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor

Où se trouve le dépôt source ?

https://github.com/omer-metin/skills-for-antigravity