| 文生图 | 根据中文文本描述生成图片 | scripts/texttoimage.py | | 图生图 | 在已有图片基础上进行编辑 | scripts/imagetoimage.py | | 图生文 | 分析图片内容(描述、OCR、图表等) | scripts/imagetotext.py | | 长图拼接 | 将多张图片垂直拼接为微信长图 | scripts/mergelongimage.py | | 调研配图 | 预设手绘风格的调研报告信息图 | scripts/researchimage.py |
| IMAGEAPIBASEURL | ${IMAGEAPIBASEURL} | | IMAGEMODEL | lyra-flash-9 | | VISIONMODEL | qwen2.5-vl-72b-instruct |
支持比例:1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
Навыки мультимодальной обработки изображений, поддержка преобразования текста в изображение, изображения в изображение, изображения в текст и сшивания длинных изображений. Срабатывает, когда пользователь упоминает такие ключевые слова, как изображение, изображение, создание изображения, инфографика, распознавание текста. Источник: zrt-ai-lab/opencode-skills.