image_understand
Analyze images from local files, URLs, or chat attachments. Provide detailed understanding based on your question or instruction about the image.
Instructions
图像理解工具:
何时调用:当用户提到“看图、看截图、看看这张图片/界面/页面/报错/架构/布局/组件结构/页面结构”等需求,或者在对话中出现图片附件并询问与图片内容相关的问题(包括 UI/前端界面结构、代码截图、日志/报错截图、文档截图、表单、表格等),都应优先调用本工具,而不是只用文本推理。
图片来源:1) 用户粘贴图片时直接调用,无需手动指定路径 2) 指定本地图片路径,如 ./screenshot.png 3) 指定图片 URL,如 https://example.com/image.png。
提示词(prompt)约定:
不要在调用本工具前自己构造一大段复杂分析提示词;
直接把“用户关于图片的原始问题/指令”作为 prompt 传入即可,例如:
“这张图是什么界面?整体结构是什么样的?”
“帮我从前端实现角度拆解这个页面的布局和组件结构”;
Luma 会在服务器内部自动拼接系统级视觉说明和分析模板,调用底层视觉模型完成完整理解;
你只需要确保 prompt 准确表达用户对这张图想了解的内容,无需重复描述图片细节或编写长篇提示词。
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| prompt | Yes | 用户关于图片的原始问题或简短指令,例如“这张图是什么界面?”、“帮我分析这个页面的结构和布局”。服务器会在内部补充系统级视觉提示词并构造完整分析指令。 | |
| image_source | Yes | 要分析的图片来源:支持三种方式 1) 用户粘贴图片时由Claude Desktop自动提供路径 2) 本地文件路径,如./screenshot.png 3) HTTP(S)图片URL,如https://example.com/image.png(支持 PNG、JPG、JPEG、WebP、GIF,最大 10MB) |