MCP PDF Server

by DeepSeekMine

Integrations

  • Enables reading and processing PDF files with tools for text extraction, OCR recognition, and image extraction from PDF documents.

  • Based on FastMCP framework which is hosted on GitHub, allowing users to leverage the MCP protocol implementation for PDF processing.

  • Requires Python 3.9+ environment to run the server, utilizing Python libraries like PyMuPDF for PDF processing functionality.

📄 MCP PDF 服务器

基于FastMCP的PDF文件阅读服务器。

支持通过MCP协议进行PDF文本提取、OCR识别、图像提取,内置Web调试器,方便测试。


🚀 功能

  • 读取 PDF 文本
    从 PDF 中提取普通文本(逐页)。
  • 通过 OCR 读取
    使用 OCR 识别扫描或基于图像的 PDF 中的文本。
  • 读取 PDF 图像
    从指定的 PDF 页面中提取所有图像(Base64 编码输出)。

📂 项目结构

mcp-pdf-server/ ├── pdf_resources/ # Directory for uploaded and processed PDF files ├── txt_server.py # Main server entry point └── README.md # Project documentation

⚙️ 安装

推荐 Python 版本:3.9+

pip install pymupdf mcp

注意:要使用 OCR 功能,您可能需要构建具有 OCR 支持或外部 OCR 库的 MuPDF。


🔦启动服务器

运行以下命令:

python txt_server.py

您应该会看到如下日志:

Serving on http://127.0.0.1:6231

🌐 Web 调试接口

打开浏览器并访问:

http://127.0.0.1:6231
  • 从左侧面板选择一个工具
  • 在右侧面板填写参数
  • 单击“运行”以测试该工具

无需编码——通过 Web UI 轻松调试和测试。


🛠️ API 工具列表

工具描述输入参数返回
read_pdf_text从 PDF 页面中提取普通文本file_pathstart_pageend_page页面文本列表
read_by_ocr通过 OCR 识别文本file_pathstart_pageend_pagelanguagedpiOCR提取的文本
read_pdf_images从 PDF 页面中提取图像file_pathpage_number图片列表(Base64编码)

📝 使用示例

从第 1 至第 5 页提取文本:

mcp run read_pdf_text --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 5}'

对第1页进行OCR识别:

mcp run read_by_ocr --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 1, "language": "eng"}'

提取第 3 页的所有图像:

mcp run read_pdf_images --args '{"file_path": "pdf_resources/example.pdf", "page_number": 3}'

📢 注释

  • 文件必须放在pdf_resources/目录中,或者必须提供绝对路径。
  • OCR 功能需要环境中适当的 OCR 支持。
  • 处理大文件时,根据需要调整内存和超时设置。

📜 许可证

该项目已获得 MIT 许可。
如需商业使用,请注明原始出处。


-
security - not tested
F
license - not found
-
quality - not tested

PDF 处理服务器通过常规解析或 OCR 提取文本,并通过内置 Web 调试器的 MCP 协议从 PDF 文件中检索图像。

  1. 🚀 功能
    1. 📂 项目结构
      1. ⚙️ 安装
        1. 🔦启动服务器
          1. 🌐 Web 调试接口
            1. 🛠️ API 工具列表
              1. 📝 使用示例
                1. 📢 注释
                  1. 📜 许可证

                    Related MCP Servers

                    • A
                      security
                      F
                      license
                      A
                      quality
                      An MCP server for converting Markdown documents to PDF files.
                      Last updated -
                      1
                      1
                      JavaScript
                    • -
                      security
                      F
                      license
                      -
                      quality
                      Provides tools for reading and extracting text from PDF files, supporting both local files and URLs.
                      Last updated -
                      3
                      Python
                    • -
                      security
                      F
                      license
                      -
                      quality
                      A server providing PDF form manipulation tools via MCP's API, allowing users to find PDFs across directories, extract form field information, and visualize form fields in documents.
                      Last updated -
                      Python
                    • A
                      security
                      F
                      license
                      A
                      quality
                      A Model Context Protocol server that converts PDF documents into PNG images through a simple MCP tool call.
                      Last updated -
                      1
                      2
                      Python
                      • Apple
                      • Linux

                    View all related MCP servers

                    ID: i94bnr2e9s