MCP-PDF2MD
MCP-PDF2MD服务
基于 MCP 的高性能 PDF 转 Markdown 转换服务,由 MinerU API 提供支持,支持本地文件和 URL 链接的批量处理,并进行结构化输出。
主要特点
- 格式转换:将PDF文件转换为结构化的Markdown格式。
- 多源支持:同时处理本地 PDF 文件和 URL 链接。
- 智能处理:自动选择最佳处理方法。
- 批量处理:支持多文件批量转换,高效处理大量PDF文件。
- MCP 集成:与 Claude Desktop 等 LLM 客户端无缝集成。
- 结构保存:维护原始文档结构,包括标题、段落、列表等。
- 智能布局:以人类可读的顺序输出文本,适用于单列、多列和复杂布局。
- 公式转换:自动识别文档中的公式并转换为 LaTeX 格式。
- 表格提取:自动识别文档中的表格并将其转换为结构化格式。
- 清理优化:删除页眉、页脚、脚注、页码等,确保语义一致性。
- 高质量提取:从 PDF 文档中高质量提取文本、图像和布局信息。
系统要求
- 软件:Python 3.10+
快速入门
- 克隆仓库并进入目录:
- 创建虚拟环境并安装依赖项:Linux/macOS :窗户:
- 配置环境变量:在项目根目录下创建
.env
文件,并设置以下环境变量: - 启动服务:
命令行参数
服务器支持以下命令行参数:
Claude桌面配置
在Claude Desktop中添加以下配置:
窗户:
Linux/macOS :
**关于 API 密钥配置的注意事项:**您可以通过两种方式设置 API 密钥:
- 在项目目录内的
.env
文件中(推荐用于开发) - 在Claude Desktop配置如上图(建议常规使用)
如果您在两个地方都设置了 API 密钥,则 Claude Desktop 配置中的密钥将优先。
MCP 工具
该服务器提供以下 MCP 工具:
- convert_pdf_url :将 PDF URL 转换为 Markdown
- convert_pdf_file :将本地 PDF 文件转换为 Markdown 文件
获取 MinerU API 密钥
本项目依赖 MinerU API 进行 PDF 内容提取。获取 API 密钥:
- 访问MinerU官网并注册账号
- 登录后,通过此链接申请API测试资质
- 您的申请获得批准后,您可以访问API 管理页面
- 按照提供的说明生成您的 API 密钥
- 复制生成的 API 密钥
- 使用此字符串作为
MINERU_API_KEY
的值
请注意,MinerU API 的访问目前处于测试阶段,需要获得 MinerU 团队的批准。审批流程可能需要一些时间,请根据实际情况做好规划。
演示
输入 PDF
输出 Markdown
执照
MIT 许可证 - 有关详细信息,请参阅 LICENSE 文件。
致谢
该项目基于MinerU的 API。
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
PDF 到 Markdown 转换工具
Related MCP Servers
- AsecurityFlicenseAqualityAn MCP server for converting Markdown documents to PDF files.Last updated -11JavaScript
- AsecurityAlicenseAqualityConverts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.Last updated -1021,611TypeScriptMIT License
- AsecurityAlicenseAqualityConverts various file formats to Markdown using the MarkItDown utility and can be integrated with MCP clients for seamless document processing and conversion.Last updated -26PythonMIT License
- -securityFlicense-qualityConverts Markdown to styled PDFs using VS Code's markdown styling and Python's ReportLab, providing a simple note storage system with custom URI scheme.Last updated -6Python