Leverage Claude's vision capabilities for image analysis, document processing, and multimodal understanding.
| JPEG | ✓ | Photos, natural scenes | | PNG | ✓ | Screenshots, UI, text | | GIF | ✓ | Animated (first frame) | | WebP | ✓ | Modern, compressed | | PDF | ✓ | Documents (via Files API) |
Funzionalità visive e multimodali per Claude, tra cui analisi delle immagini, elaborazione PDF e comprensione dei documenti. Attiva per input di immagini, codifica base64, immagini multiple e analisi visiva. Fonte: lobbi-docs/claude.
Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/lobbi-docs/claude --skill vision-multimodal Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw