MCP Mistral OCR
一个使用 Mistral AI 的 OCR API 提供 OCR 功能的 MCP 服务器。该服务器可以处理本地文件和 URL,并支持图像和 PDF。
特征
使用 Mistral 的 OCR 处理本地文件(图像和 PDF)
处理来自具有明确文件类型规范的 URL 的文件
支持多种文件格式(JPG、PNG、PDF等)
结果保存为带有时间戳的 JSON 文件
Docker 容器化
UV包管理
Related MCP server: Handwriting OCR MCP Server
环境变量
MISTRAL_API_KEY:您的 Mistral AI API 密钥OCR_DIR:本地文件处理的目录路径。在容器内部,此目录始终映射到/data/ocr
安装
通过 Smithery 安装
要通过Smithery自动为 Claude Desktop 安装 Mistral OCR:
使用 Docker
构建 Docker 镜像:
运行容器:
本地开发
安装 UV 包管理器:
创建并激活虚拟环境:
安装依赖项:
Claude桌面配置
将此配置添加到您的 claude_desktop_config.json:
可用工具
1. process_local_file
从配置的 OCR_DIR 目录中处理文件。
2. process_url_file
处理来自 URL 的文件。需要明确指定文件类型。
输出
OCR 结果以 JSON 格式保存在OCR_DIR output目录中。每个结果文件使用以下格式命名:
对于本地文件:
{original_filename}_{timestamp}.json对于 URL:如果在 URL 中未找到文件名,则为
{url_filename}_{timestamp}.json或url_document_{timestamp}.json
时间戳格式为YYYYMMDD_HHMMSS 。
支持的文件类型
图像:JPG、JPEG、PNG、GIF、WebP
文档:PDF 和 Mistral OCR 支持的其他文档格式
限制
最大文件大小:50MB(由 Mistral API 强制执行)
最大文档页数:1000(由 Mistral API 强制执行)