Skip to main content
Glama

📄 MCP PDF 服务器

基于FastMCP的PDF文件阅读服务器。

支持通过MCP协议进行PDF文本提取、OCR识别、图像提取,内置Web调试器,方便测试。


🚀 功能

  • 读取 PDF 文本
    从 PDF 中提取普通文本(逐页)。

  • 通过 OCR 读取
    使用 OCR 识别扫描或基于图像的 PDF 中的文本。

  • 读取 PDF 图像
    从指定的 PDF 页面中提取所有图像(Base64 编码输出)。


Related MCP server: Textin MCP Server

📂 项目结构

mcp-pdf-server/
├── pdf_resources/        # Directory for uploaded and processed PDF files
├── txt_server.py         # Main server entry point
└── README.md             # Project documentation

⚙️ 安装

推荐 Python 版本:3.9+

pip install pymupdf mcp

注意:要使用 OCR 功能,您可能需要构建具有 OCR 支持或外部 OCR 库的 MuPDF。


🔦启动服务器

运行以下命令:

python txt_server.py

您应该会看到如下日志:

Serving on http://127.0.0.1:6231

🌐 Web 调试接口

打开浏览器并访问:

http://127.0.0.1:6231
  • 从左侧面板选择一个工具

  • 在右侧面板填写参数

  • 单击“运行”以测试该工具

无需编码——通过 Web UI 轻松调试和测试。


🛠️ API 工具列表

工具

描述

输入参数

返回

read_pdf_text

从 PDF 页面中提取普通文本

file_pathstart_pageend_page

页面文本列表

read_by_ocr

通过 OCR 识别文本

file_pathstart_pageend_pagelanguagedpi

OCR提取的文本

read_pdf_images

从 PDF 页面中提取图像

file_pathpage_number

图片列表(Base64编码)


📝 使用示例

从第 1 至第 5 页提取文本:

mcp run read_pdf_text --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 5}'

对第1页进行OCR识别:

mcp run read_by_ocr --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 1, "language": "eng"}'

提取第 3 页的所有图像:

mcp run read_pdf_images --args '{"file_path": "pdf_resources/example.pdf", "page_number": 3}'

📢 注释

  • 文件必须放在pdf_resources/目录中,或者必须提供绝对路径。

  • OCR 功能需要环境中适当的 OCR 支持。

  • 处理大文件时,根据需要调整内存和超时设置。


📜 许可证

该项目已获得 MIT 许可。
如需商业使用,请注明原始出处。


-
security - not tested
F
license - not found
-
quality - not tested

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/DeepSeekMine/mcp-pdf-reader'

If you have feedback or need assistance with the MCP directory API, please join our Discord server