Come installo ai-multimodal?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/samhvw8/dot-claude --skill ai-multimodal Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

·ai-multimodal

ai-multimodal

Name: ai-multimodal
Author: samhvw8

✓

samhvw8/dot-claude

Elaborazione AI multimodale tramite API Google Gemini (contesto di token 2M). Funzionalità: audio (trascrizione, massimo 9,5 ore, riepilogo, analisi musicale), immagini (sottotitoli, OCR, rilevamento di oggetti, segmentazione, domande e risposte visive), video (rilevamento di scene, massimo 6 ore, URL di YouTube, analisi temporale), documenti (estrazione PDF, tabelle, moduli, grafici), generazione di immagini (da testo a immagine, modifica). Azioni: trascrivere, analizzare, estrarre, didascalia, rilevare, segmentare, generare dai media. Parole chiave: API Gemini, trascrizione audio, sottotitoli immagini, OCR, rilevamento oggetti, analisi video, estrazione PDF, conversione da testo a immagine, multimodale, riconoscimento vocale, domande e risposte visive, rilevamento scene, trascrizione YouTube, estrazione tabelle, elaborazione moduli, generazione immagini, Imagen. Utilizzare quando: trascrivere audio/video, analizzare immagini/screenshot, estrarre dati da PDF, elaborare video di YouTube, generare immagini da testo, implementare funzionalità AI multimodali.

samhvw8·ai·multimodal

26Installazioni·0Tendenza·@samhvw8