Use PaddleOCR to extract text content from images. Supports single image or batch processing.
This skill provides optical character recognition (OCR) capabilities using the PaddlePaddle/PaddleOCR-VL-1.5 model via the SiliconFlow API. Extract text from JPG, PNG, WebP, BMP, and GIF images.
| images | Image file path(s) or glob pattern (required) | | -k, --api-key | API key (default: from SILICONFLOWAPIKEY env) | | -m, --model | OCR model name (default: PaddlePaddle/PaddleOCR-VL-1.5) | | -p, --prompt | Recognition prompt for custom behavior | | -j, --json | Output results in JSON format | | -o, --output | Save results to specified file |
OCR-Fähigkeit mithilfe des PaddleOCR-Modells über die SiliconFlow-API. Diese Fähigkeit sollte verwendet werden, wenn der Benutzer „Text aus einem Bild erkennen“, „Text aus einem Foto extrahieren“, „OCR dieses Bildes“, „Text aus Screenshot lesen“ auffordert oder „PaddleOCR“, „Bildtexterkennung“ oder „Textextraktion aus Bildern“ erwähnt. Quelle: aotenjou/silicon-paddleocr.