MinerU Open MCP (Official)
MinerU Open MCP
一个官方的 MinerU MCP 服务器,将 MinerU 的文档解析功能作为 MCP 工具提供。连接任何兼容 MCP 的 AI 客户端,即可将 PDF、Word 文档、PowerPoint 文件和图像转换为 Markdown。
无需 API Key — Flash 模式开箱即用,免费且无需注册,支持最多 20 页 / 10 MB 的文件。设置 MINERU_API_TOKEN 可解锁更高的限制和额外的输出格式。
⚡ 最快捷的运行方式 — uvx (无需安装)
mineru-open-mcp 已发布在 PyPI 上。如果安装了 uv,你可以直接运行它 — 无需单独的安装步骤。
配置你的 MCP 客户端
stdio — Claude Desktop, Cursor, Windsurf
MCP 客户端会自动将 mineru-open-mcp 作为子进程启动。
使用 uvx (推荐 — 始终运行最新版本):
{
"mcpServers": {
"mineru": {
"command": "uvx",
"args": ["mineru-open-mcp"],
"env": {
"MINERU_API_TOKEN": "your_key_here"
}
}
}
}没有 API Key? 服务器以 Flash 模式运行 — 免费,仅限 Markdown 输出,详情请参阅 Flash 模式文档
mineru-open-mcp不在 PATH 中? 请使用完整路径:"/Users/you/.local/bin/mineru-open-mcp",或者使用上述uvx方法,它会自动处理此问题。
使用示例
示例 1:解析带有目标页码范围的本地 PDF 文档
用户提示词: "将此 PDF 的第 3-5 页解析为 markdown:<your_path_to_file>" 执行过程:
MinerU 上传并解析 PDF
返回保留了表格 (HTML) 和公式 (Latex) 的整洁 Markdown
如果长度允许,在聊天中返回 markdown 文本以及输出路径,如果需要,还会提供 zip 下载链接
MCP 客户端总结内容
示例 2:解析托管文件的远程 URL
用户提示词: "提取此论文的内容:https://arxiv.org/pdf/2509.22186" 执行过程:
MinerU 将论文解析为 markdown
MCP 客户端格式化并解释表格
示例 3:解析带有独立页码范围的本地 PDF 文件
用户提示词: "将 第 1-5 页, 第 2-9 页, 第 3 页解析为 markdown" 执行过程:
MinerU 分别上传并解析文件
返回目标格式输出、供你下载的 zip 链接、markdown 摘要以及你想要保存输出的目录
MCP 客户端使用这些内容进行进一步分析
示例 4:高级自定义偏好设置
用户提示词 1: "使用 pipeline 模型解析此韩语文件 your_path_here" 用户提示词 2: "解析 your_path_here 并将 markdown 保存到 your_output_dir" 执行过程:
Pipeline 模型是 MinerU 服务提供的另一种模型(顺便说一下,vlm 模型是默认选择)
你可以通过构建提示词来指定模型、OCR 语言,甚至指定一个不同于 OUTPUT_DIR 的独立输出目录
你的请求会被参数化为 parse_documents 工具,MinerU 将处理其余部分。
streamable-http — 基于 Web 的 MCP 客户端
手动启动服务器,然后将你的客户端指向它:
MINERU_API_TOKEN=your_key mineru-open-mcp --transport streamable-http --port 8001{
"mcpServers": {
"mineru": {
"type": "streamableHttp",
"url": "http://127.0.0.1:8001/mcp"
}
}
}功能
parse_documents— 将本地文件和/或远程 URL 转换为 Markdown;输入支持 PDF、图像(png/jpg/jpeg/jp2/webp/gif/bmp)、Doc、Docx、Ppt、PPTx。Flash 模式还支持 xlsx。get_ocr_languages— 列出 MinerU 支持的所有 OCR 语言Flash 模式 — 无需 API Key 即可工作(免费,仅限 Markdown 输出,支持 PDF/图像/Docx/PPTx/xls/xlsx);如需完整功能,请提供
MINERU_API_TOKEN,这将禁用 Flash 模式。输出行为 — 单文件解析默认返回内联 Markdown;批量解析将结果保存到磁盘并返回文件元数据。过大的内联内容也会在本地保存,并通过
extract_path返回。两种传输模式 —
stdio,streamable-http
环境变量
变量 | 描述 | 默认值 |
| MinerU API Token,在 MinerU 申请以获取完整功能。如果不提供,则启用 Flash 模式。 | — |
| 当解析结果需要本地保存时使用的目录,例如批量解析或过大的内联内容 |
|
隐私政策
mineru-open-mcp 连接到官方 MinerU API (mineru.net) 以解析文档。
发送的数据:文档内容(你提供用于解析的文件或 URL)
数据存储:解析结果由 MinerU 服务器临时缓存;不用于训练
第三方:MinerU API (mineru.net) — 请参阅 MinerU 隐私政策
本地数据:解析结果将保存到目标输出目录。日志文件(仅当 ENABLE_LOG=true 时)保存到 MINERU_LOG_DIR;
联系方式:OpenDataLab@pjlab.org.cn (或在 MinerU-Ecosystem 提交 issue)
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/opendatalab/MinerU-Ecosystem'
If you have feedback or need assistance with the MCP directory API, please join our Discord server