Skip to main content
Glama

MinerU Open MCP

一个官方的 MinerU MCP 服务器,将 MinerU 的文档解析功能作为 MCP 工具提供。连接任何兼容 MCP 的 AI 客户端,即可将 PDF、Word 文档、PowerPoint 文件和图像转换为 Markdown。

无需 API Key — Flash 模式开箱即用,免费且无需注册,支持最多 20 页 / 10 MB 的文件。设置 MINERU_API_TOKEN 可解锁更高的限制和额外的输出格式。


⚡ 最快捷的运行方式 — uvx (无需安装)

mineru-open-mcp 已发布在 PyPI 上。如果安装了 uv,你可以直接运行它 — 无需单独的安装步骤。

配置你的 MCP 客户端

stdio — Claude Desktop, Cursor, Windsurf

MCP 客户端会自动将 mineru-open-mcp 作为子进程启动。

使用 uvx (推荐 — 始终运行最新版本):

{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "your_key_here"
      }
    }
  }
}

没有 API Key? 服务器以 Flash 模式运行 — 免费,仅限 Markdown 输出,详情请参阅 Flash 模式文档

mineru-open-mcp 不在 PATH 中? 请使用完整路径:"/Users/you/.local/bin/mineru-open-mcp",或者使用上述 uvx 方法,它会自动处理此问题。

使用示例

示例 1:解析带有目标页码范围的本地 PDF 文档

用户提示词: "将此 PDF 的第 3-5 页解析为 markdown:<your_path_to_file>" 执行过程:

  • MinerU 上传并解析 PDF

  • 返回保留了表格 (HTML) 和公式 (Latex) 的整洁 Markdown

  • 如果长度允许,在聊天中返回 markdown 文本以及输出路径,如果需要,还会提供 zip 下载链接

  • MCP 客户端总结内容

示例 2:解析托管文件的远程 URL

用户提示词: "提取此论文的内容:https://arxiv.org/pdf/2509.22186" 执行过程:

  • MinerU 将论文解析为 markdown

  • MCP 客户端格式化并解释表格

示例 3:解析带有独立页码范围的本地 PDF 文件

用户提示词: "将 第 1-5 页, 第 2-9 页, 第 3 页解析为 markdown" 执行过程:

  • MinerU 分别上传并解析文件

  • 返回目标格式输出、供你下载的 zip 链接、markdown 摘要以及你想要保存输出的目录

  • MCP 客户端使用这些内容进行进一步分析

示例 4:高级自定义偏好设置

用户提示词 1: "使用 pipeline 模型解析此韩语文件 your_path_here" 用户提示词 2: "解析 your_path_here 并将 markdown 保存到 your_output_dir" 执行过程:

  • Pipeline 模型是 MinerU 服务提供的另一种模型(顺便说一下,vlm 模型是默认选择)

  • 你可以通过构建提示词来指定模型、OCR 语言,甚至指定一个不同于 OUTPUT_DIR 的独立输出目录

  • 你的请求会被参数化为 parse_documents 工具,MinerU 将处理其余部分。

streamable-http — 基于 Web 的 MCP 客户端

手动启动服务器,然后将你的客户端指向它:

MINERU_API_TOKEN=your_key mineru-open-mcp --transport streamable-http --port 8001
{
  "mcpServers": {
    "mineru": {
      "type": "streamableHttp",
      "url": "http://127.0.0.1:8001/mcp"
    }
  }
}

功能

  • parse_documents — 将本地文件和/或远程 URL 转换为 Markdown;输入支持 PDF、图像(png/jpg/jpeg/jp2/webp/gif/bmp)、Doc、Docx、Ppt、PPTx。Flash 模式还支持 xlsx。

  • get_ocr_languages — 列出 MinerU 支持的所有 OCR 语言

  • Flash 模式 — 无需 API Key 即可工作(免费,仅限 Markdown 输出,支持 PDF/图像/Docx/PPTx/xls/xlsx);如需完整功能,请提供 MINERU_API_TOKEN,这将禁用 Flash 模式。

  • 输出行为 — 单文件解析默认返回内联 Markdown;批量解析将结果保存到磁盘并返回文件元数据。过大的内联内容也会在本地保存,并通过 extract_path 返回。

  • 两种传输模式stdio, streamable-http


环境变量

变量

描述

默认值

MINERU_API_TOKEN

MinerU API Token,在 MinerU 申请以获取完整功能。如果不提供,则启用 Flash 模式。

OUTPUT_DIR

当解析结果需要本地保存时使用的目录,例如批量解析或过大的内联内容

~/mineru-downloads

隐私政策

mineru-open-mcp 连接到官方 MinerU API (mineru.net) 以解析文档。

  • 发送的数据:文档内容(你提供用于解析的文件或 URL)

  • 数据存储:解析结果由 MinerU 服务器临时缓存;不用于训练

  • 第三方:MinerU API (mineru.net) — 请参阅 MinerU 隐私政策

  • 本地数据:解析结果将保存到目标输出目录。日志文件(仅当 ENABLE_LOG=true 时)保存到 MINERU_LOG_DIR;

  • 联系方式OpenDataLab@pjlab.org.cn (或在 MinerU-Ecosystem 提交 issue)

Install Server
A
security – no known vulnerabilities
A
license - permissive license
C
quality - C tier

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/opendatalab/MinerU-Ecosystem'

If you have feedback or need assistance with the MCP directory API, please join our Discord server