Use PaddleOCR to extract text content from images. Supports single image or batch processing.
This skill provides optical character recognition (OCR) capabilities using the PaddlePaddle/PaddleOCR-VL-1.5 model via the SiliconFlow API. Extract text from JPG, PNG, WebP, BMP, and GIF images.
| images | Image file path(s) or glob pattern (required) | | -k, --api-key | API key (default: from SILICONFLOWAPIKEY env) | | -m, --model | OCR model name (default: PaddlePaddle/PaddleOCR-VL-1.5) | | -p, --prompt | Recognition prompt for custom behavior | | -j, --json | Output results in JSON format | | -o, --output | Save results to specified file |
Habilidad de OCR utilizando el modelo PaddleOCR a través de SiliconFlow API. Esta habilidad debe usarse cuando el usuario solicita "reconocer texto de una imagen", "extraer texto de una foto", "OCR esta imagen", "leer texto de una captura de pantalla" o menciona "PaddleOCR", "reconocimiento de texto de imagen", "extracción de texto de imágenes". Fuente: aotenjou/silicon-paddleocr.