extract_image_text
Extract textual content from images using multimodal AI OCR. Upload an image via URL, file path, or base64 encoding to retrieve recognized text.
Instructions
使用多模态大模型 OCR 能力提取图片中的文字内容。
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| image | No | Messages API 格式的图片内容块 | |
| image_url | No | 图片的 HTTP/HTTPS URL 地址 | |
| mime_type | No | 当使用 image_base64 时,指定图片 MIME 类型,例如 image/png、image/jpeg | |
| image_path | No | 本地图片文件的绝对或相对路径 | |
| image_base64 | No | 图片的 base64 编码字符串(不包含 data URI 前缀) |