Skip to main content
Glama

MCP PDF Server

by DeepSeekMine

📄 MCP PDF 服务器

基于FastMCP的PDF文件阅读服务器。

支持通过MCP协议进行PDF文本提取、OCR识别、图像提取,内置Web调试器,方便测试。


🚀 功能

  • 读取 PDF 文本
    从 PDF 中提取普通文本(逐页)。
  • 通过 OCR 读取
    使用 OCR 识别扫描或基于图像的 PDF 中的文本。
  • 读取 PDF 图像
    从指定的 PDF 页面中提取所有图像(Base64 编码输出)。

📂 项目结构

mcp-pdf-server/ ├── pdf_resources/ # Directory for uploaded and processed PDF files ├── txt_server.py # Main server entry point └── README.md # Project documentation

⚙️ 安装

推荐 Python 版本:3.9+

pip install pymupdf mcp

注意:要使用 OCR 功能,您可能需要构建具有 OCR 支持或外部 OCR 库的 MuPDF。


🔦启动服务器

运行以下命令:

python txt_server.py

您应该会看到如下日志:

Serving on http://127.0.0.1:6231

🌐 Web 调试接口

打开浏览器并访问:

http://127.0.0.1:6231
  • 从左侧面板选择一个工具
  • 在右侧面板填写参数
  • 单击“运行”以测试该工具

无需编码——通过 Web UI 轻松调试和测试。


🛠️ API 工具列表

工具描述输入参数返回
read_pdf_text从 PDF 页面中提取普通文本file_pathstart_pageend_page页面文本列表
read_by_ocr通过 OCR 识别文本file_pathstart_pageend_pagelanguagedpiOCR提取的文本
read_pdf_images从 PDF 页面中提取图像file_pathpage_number图片列表(Base64编码)

📝 使用示例

从第 1 至第 5 页提取文本:

mcp run read_pdf_text --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 5}'

对第1页进行OCR识别:

mcp run read_by_ocr --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 1, "language": "eng"}'

提取第 3 页的所有图像:

mcp run read_pdf_images --args '{"file_path": "pdf_resources/example.pdf", "page_number": 3}'

📢 注释

  • 文件必须放在pdf_resources/目录中,或者必须提供绝对路径。
  • OCR 功能需要环境中适当的 OCR 支持。
  • 处理大文件时,根据需要调整内存和超时设置。

📜 许可证

该项目已获得 MIT 许可。
如需商业使用,请注明原始出处。


-
security - not tested
F
license - not found
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

PDF 处理服务器通过常规解析或 OCR 提取文本,并通过内置 Web 调试器的 MCP 协议从 PDF 文件中检索图像。

  1. 🚀 功能
    1. 📂 项目结构
      1. ⚙️ 安装
        1. 🔦启动服务器
          1. 🌐 Web 调试接口
            1. 🛠️ API 工具列表
              1. 📝 使用示例
                1. 📢 注释
                  1. 📜 许可证

                    Related MCP Servers

                    • A
                      security
                      F
                      license
                      A
                      quality
                      An MCP server that provides a tool to extract text content from local PDF files, supporting both standard PDF reading and OCR capabilities with optional page selection.
                      Last updated -
                      1
                      17
                      • Apple
                    • A
                      security
                      A
                      license
                      A
                      quality
                      A server that enables OCR capabilities to recognize text from images, PDFs, and Word documents, convert them to Markdown, and extract key information.
                      Last updated -
                      3
                      110
                      23
                      MIT License
                    • -
                      security
                      A
                      license
                      -
                      quality
                      A Model Context Protocol (MCP) based server that efficiently manages PDF files, allowing AI coding tools like Cursor to read, summarize, and extract information from PDF datasheets to assist embedded development work.
                      Last updated -
                      7
                      Apache 2.0
                    • -
                      security
                      F
                      license
                      -
                      quality
                      An MCP server that provides comprehensive PDF processing capabilities including text extraction, image extraction, table detection, annotation extraction, metadata retrieval, page rendering, and document structure analysis.
                      Last updated -
                      • Apple

                    View all related MCP servers

                    MCP directory API

                    We provide all the information about MCP servers via our MCP API.

                    curl -X GET 'https://glama.ai/api/mcp/v1/servers/DeepSeekMine/mcp-pdf-reader'

                    If you have feedback or need assistance with the MCP directory API, please join our Discord server