ollama-vision-mcp
Provides image understanding capabilities using local Ollama multimodal models, allowing analysis, comparison, and OCR of images.
Click on "Install Server".
Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state.
In the chat, type
@followed by the MCP server name and your instructions, e.g., "@ollama-vision-mcpanalyze this image: C:\photos\cat.jpg"
That's it! The server will respond to your query, and you can continue using it as needed.
Here is a step-by-step guide with screenshots.
🖼️ MCP 图片理解服务器
基于 MCP (Model Context Protocol) 的图片理解服务器,让纯文本模型(如 Codex CLI / DeepSeek)也能看懂图片内容。
通过调用本地 Ollama 多模态模型(如 minicpm-o4.5)进行图片分析,无需调用任何云端视觉 API,数据完全本地处理。
✨ 功能
🔍
analyze_image— 分析单张图片,支持自定义提问🆚
analyze_images— 多图(最多 5 张)对比分析📝
ocr_image— 从图片中提取文字(支持中英文)🔄 支持本地图片和 URL 图片
Related MCP server: Vision MCP
📋 前置要求
组件 | 说明 |
Python 3.10+ | 运行环境 |
本地多模态模型服务 | |
多模态模型 | 如 |
安装 Ollama 并拉取模型:
ollama pull minicpm-o4.5🚀 快速开始
1️⃣ 安装依赖
方式一:运行脚本(推荐)
setup.bat方式二:手动安装
python -m venv venv
venv\Scripts\activate
pip install -r requirements.txt2️⃣ 启动 Ollama(如未运行)
ollama serve3️⃣ 配置 MCP JSON
在 MCP 客户端(如 Codex CLI / Claude Desktop / Cursor 等)的配置文件中,添加以下条目:
{
"mcpServers": {
"image-understanding": {
"command": "python",
"args": ["F:/path/to/my-image-server/run.py"],
"env": {
"OLLAMA_HOST": "http://localhost:11434",
"VISION_MODEL": "minicpm-o4.5",
"OLLAMA_TIMEOUT": "120"
}
}
}
}⚠️ 将
F:/path/to/my-image-server替换为你项目所在的实际路径。
📁 不同客户端的配置位置
客户端 | 配置文件路径 |
Codex CLI |
|
Claude Desktop | Settings → Developer → Edit Config → |
Cursor | Settings → Features → MCP → Add new MCP server |
⚙️ 环境变量
变量 | 默认值 | 说明 |
|
| Ollama 服务地址 |
|
| 使用的多模态模型名称 |
|
| 请求超时时间(秒),大图片可适当调大 |
也可以直接在命令行中临时设置:
set OLLAMA_HOST=http://localhost:11434
set VISION_MODEL=llava
python run.py🧩 提供的 MCP Tools
analyze_image
参数 | 类型 | 必填 | 说明 |
| string | ✅ | 本地路径或 URL |
| string | ❌ | 针对图片的问题,默认"请详细描述这张图片的内容" |
analyze_images
参数 | 类型 | 必填 | 说明 |
| string[] | ✅ | 图片路径列表(最多 5 张) |
| string | ❌ | 对比分析问题 |
ocr_image
参数 | 类型 | 必填 | 说明 |
| string | ✅ | 本地路径或 URL |
💡 在对话中使用示例
> 分析这张图片:C:\photos\cat.jpg
> 对比这两张图有什么不同:img1.png 和 img2.png
> 提取这张截图里的所有文字:screenshot.png
> 这个网页截图里的按钮是做什么的?https://example.com/screenshot.png🏗️ 项目结构
my-image-server/
├── run.py # MCP 服务器主程序
├── requirements.txt # Python 依赖
├── setup.bat # Windows 环境初始化脚本
├── venv/ # Python 虚拟环境
└── README.md # 本文件📄 License
MIT
This server cannot be installed
Maintenance
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/Ntzy123/ollama-vision-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server