MCP PDF 服务器

📄 MCP PDF 服务器

基于FastMCP的PDF文件阅读服务器。

支持通过MCP协议进行PDF文本提取、OCR识别、图像提取，内置Web调试器，方便测试。

🚀 功能

读取 PDF 文本
从 PDF 中提取普通文本（逐页）。
通过 OCR 读取
使用 OCR 识别扫描或基于图像的 PDF 中的文本。
读取 PDF 图像
从指定的 PDF 页面中提取所有图像（Base64 编码输出）。

📂 项目结构

mcp-pdf-server/
├── pdf_resources/        # Directory for uploaded and processed PDF files
├── txt_server.py         # Main server entry point
└── README.md             # Project documentation

⚙️ 安装

🔦启动服务器

运行以下命令：

python txt_server.py

您应该会看到如下日志：

Serving on http://127.0.0.1:6231

🌐 Web 调试接口

打开浏览器并访问：

http://127.0.0.1:6231

从左侧面板选择一个工具
在右侧面板填写参数
单击“运行”以测试该工具

无需编码——通过 Web UI 轻松调试和测试。

🛠️ API 工具列表

工具	描述	输入参数	返回
`read_pdf_text`	从 PDF 页面中提取普通文本	`file_path` 、 `start_page` 、 `end_page`	页面文本列表
`read_by_ocr`	通过 OCR 识别文本	`file_path` 、 `start_page` 、 `end_page` 、 `language` 、 `dpi`	OCR提取的文本
`read_pdf_images`	从 PDF 页面中提取图像	`file_path` 、 `page_number`	图片列表（Base64编码）

📝 使用示例

从第 1 至第 5 页提取文本：

mcp run read_pdf_text --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 5}'

对第1页进行OCR识别：

mcp run read_by_ocr --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 1, "language": "eng"}'

提取第 3 页的所有图像：

mcp run read_pdf_images --args '{"file_path": "pdf_resources/example.pdf", "page_number": 3}'

📢 注释

文件必须放在pdf_resources/目录中，或者必须提供绝对路径。
OCR 功能需要环境中适当的 OCR 支持。
处理大文件时，根据需要调整内存和超时设置。

📜 许可证

该项目已获得 MIT 许可。
如需商业使用，请注明原始出处。

MCP PDF Server

📄 MCP PDF 服务器

🚀 功能

📂 项目结构

⚙️ 安装

🔦启动服务器

🌐 Web 调试接口

🛠️ API 工具列表

📝 使用示例

📢 注释

📜 许可证

Related MCP Servers

markdown2pdf-mcp

PDF Reader MCP Server

MCP PDF Forms

PDF to PNG MCP Server

Appeared in Searches

New MCP Servers

MCP directory API