·vision-language-models
{}

vision-language-models

yonatangross/skillforge-claude-plugin

GPT-5/4o, Claude 4.5, Gemini 2.5/3, Grok 4 patrones de visión para análisis de imágenes, comprensión de documentos y control de calidad visual. Utilícelo al implementar subtítulos de imágenes, análisis de documentos/gráficos o comparación de varias imágenes.

4Instalaciones·0Tendencia·@yonatangross

Instalación

$npx skills add https://github.com/yonatangross/skillforge-claude-plugin --skill vision-language-models

SKILL.md

Integrate vision capabilities from leading multimodal models for image understanding, document analysis, and visual reasoning.

| Model | Context | Strengths | Vision Input |

| GPT-5.2 | 128K | Best general reasoning, multimodal | Up to 10 images | | Claude Opus 4.5 | 200K | Best coding, sustained agent tasks | Up to 100 images | | Gemini 2.5 Pro | 1M+ | Longest context, video analysis | 3,600 images max | | Gemini 3 Pro | 1M | Deep Think, 100% AIME 2025 | Enhanced segmentation |

GPT-5/4o, Claude 4.5, Gemini 2.5/3, Grok 4 patrones de visión para análisis de imágenes, comprensión de documentos y control de calidad visual. Utilícelo al implementar subtítulos de imágenes, análisis de documentos/gráficos o comparación de varias imágenes. Fuente: yonatangross/skillforge-claude-plugin.

Ver original

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/yonatangross/skillforge-claude-plugin --skill vision-language-models
Categoría
{}Análisis de Datos
Verificado
Primera vez visto
2026-02-01
Actualizado
2026-02-18

Respuestas rápidas

¿Qué es vision-language-models?

GPT-5/4o, Claude 4.5, Gemini 2.5/3, Grok 4 patrones de visión para análisis de imágenes, comprensión de documentos y control de calidad visual. Utilícelo al implementar subtítulos de imágenes, análisis de documentos/gráficos o comparación de varias imágenes. Fuente: yonatangross/skillforge-claude-plugin.

¿Cómo instalo vision-language-models?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/yonatangross/skillforge-claude-plugin --skill vision-language-models Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor

¿Dónde está el repositorio de origen?

https://github.com/yonatangross/skillforge-claude-plugin