Skip to main content
Glama

📄 MCP PDF 服务器

基于FastMCP的PDF文件阅读服务器。

支持通过MCP协议进行PDF文本提取、OCR识别、图像提取,内置Web调试器,方便测试。


🚀 功能

  • 读取 PDF 文本
    从 PDF 中提取普通文本(逐页)。

  • 通过 OCR 读取
    使用 OCR 识别扫描或基于图像的 PDF 中的文本。

  • 读取 PDF 图像
    从指定的 PDF 页面中提取所有图像(Base64 编码输出)。


Related MCP server: Textin MCP Server

📂 项目结构

mcp-pdf-server/ ├── pdf_resources/ # Directory for uploaded and processed PDF files ├── txt_server.py # Main server entry point └── README.md # Project documentation

⚙️ 安装

推荐 Python 版本:3.9+

pip install pymupdf mcp

注意:要使用 OCR 功能,您可能需要构建具有 OCR 支持或外部 OCR 库的 MuPDF。


🔦启动服务器

运行以下命令:

python txt_server.py

您应该会看到如下日志:

Serving on http://127.0.0.1:6231

🌐 Web 调试接口

打开浏览器并访问:

http://127.0.0.1:6231
  • 从左侧面板选择一个工具

  • 在右侧面板填写参数

  • 单击“运行”以测试该工具

无需编码——通过 Web UI 轻松调试和测试。


🛠️ API 工具列表

工具

描述

输入参数

返回

read_pdf_text

从 PDF 页面中提取普通文本

file_path

start_page

end_page

页面文本列表

read_by_ocr

通过 OCR 识别文本

file_path

start_page

end_page

language

dpi

OCR提取的文本

read_pdf_images

从 PDF 页面中提取图像

file_path

page_number

图片列表(Base64编码)


📝 使用示例

从第 1 至第 5 页提取文本:

mcp run read_pdf_text --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 5}'

对第1页进行OCR识别:

mcp run read_by_ocr --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 1, "language": "eng"}'

提取第 3 页的所有图像:

mcp run read_pdf_images --args '{"file_path": "pdf_resources/example.pdf", "page_number": 3}'

📢 注释

  • 文件必须放在pdf_resources/目录中,或者必须提供绝对路径。

  • OCR 功能需要环境中适当的 OCR 支持。

  • 处理大文件时,根据需要调整内存和超时设置。


📜 许可证

该项目已获得 MIT 许可。
如需商业使用,请注明原始出处。


-
security - not tested
F
license - not found
-
quality - not tested

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/DeepSeekMine/mcp-pdf-reader'

If you have feedback or need assistance with the MCP directory API, please join our Discord server