describe_image
Describe an image using a vision model. Supports local file paths and public URLs for analyzing UI, text, objects, and scenes.
Instructions
使用视觉模型描述一张图片的内容。支持传入本地绝对路径或公网 URL,自动识别路径类型并处理。适合分析 UI 界面、提取图片中的文字、识别物体和场景等。
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| image | Yes | 图片路径:本地绝对路径(如 /Users/name/Pictures/photo.jpg)或公网 URL(如 https://example.com/image.png) | |
| detail | No | 视觉精度,默认 auto。传什么就用什么,直接透传给 API。 | |
| prompt | No | 可选的描述指引,例如"描述这张图片中的文字"或"分析这个UI界面布局和交互元素" |