Leverage Claude's vision capabilities for image analysis, document processing, and multimodal understanding.
| JPEG | ✓ | Photos, natural scenes | | PNG | ✓ | Screenshots, UI, text | | GIF | ✓ | Animated (first frame) | | WebP | ✓ | Modern, compressed | | PDF | ✓ | Documents (via Files API) |
Возможности видения и мультимодальности для Клода, включая анализ изображений, обработку PDF-файлов и понимание документов. Активируйте для ввода изображений, кодирования base64, нескольких изображений и визуального анализа. Источник: lobbi-docs/claude.
Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/lobbi-docs/claude --skill vision-multimodal После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw