Comment installer ai-multimodal ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/samhvw8/dot-claude --skill ai-multimodal Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor

·ai-multimodal

ai-multimodal

Name: ai-multimodal
Author: samhvw8

✓

samhvw8/dot-claude

Traitement de l'IA multimodale via l'API Google Gemini (contexte 2M tokens). Capacités : audio (transcription, 9,5 heures max, résumé, analyse musicale), images (sous-titres, OCR, détection d'objets, segmentation, questions-réponses visuelles), vidéo (détection de scène, 6 heures max, URL YouTube, analyse temporelle), documents (extraction PDF, tableaux, formulaires, graphiques), génération d'images (texte à image, édition). Actions : transcrire, analyser, extraire, sous-titrer, détecter, segmenter, générer à partir d'un média. Mots clés : API Gemini, transcription audio, sous-titrage d'images, OCR, détection d'objets, analyse vidéo, extraction de PDF, texte en image, multimodal, reconnaissance vocale, questions-réponses visuelles, détection de scène, transcription YouTube, extraction de tableaux, traitement de formulaires, génération d'images, Imagen. À utiliser pour : transcrire de l'audio/vidéo, analyser des images/captures d'écran, extraire des données de PDF, traiter des vidéos YouTube, générer des images à partir de texte, mettre en œuvre des fonctionnalités d'IA multimodales.

samhvw8·ai·multimodal

11Installations·0Tendance·@samhvw8