PDF Document MCP Server
PDF 文档 MCP 服务器
由 MEOK AI Labs 提供 | meok.ai
为 AI 智能体提供的文档处理工具包。提取文本、转换为 Markdown、合并 PDF、提取表格并总结文档——全部在本地完成,无需任何外部 API 依赖。
工具
工具 | 描述 |
| 从 PDF 的所有页面或指定页面中提取文本 |
| 将 PDF 转换为带有标题检测的结构化 Markdown |
| 将多个 PDF 文件合并为一个文档 |
| 使用位置分析从 PDF 页面中提取表格结构 |
| 生成元数据、统计信息、标题以及每页摘要 |
安装
pip install mcp PyMuPDF无需外部服务、API 密钥或云依赖。所有处理均在本地进行。
使用方法
运行服务器
python server.pyClaude Desktop 配置
{
"mcpServers": {
"pdf-document": {
"command": "python",
"args": ["/path/to/pdf-document-mcp/server.py"]
}
}
}调用示例
从 PDF 中提取文本:
Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf"}
Output: {"total_pages": 12, "total_characters": 48320, "pages": [{"page": 1, "text": "...", "char_count": 4210}, ...]}仅提取特定页面:
Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf", "pages": [1, 3, 5]}
Output: {"extracted_pages": 3, "pages": [...]}将 PDF 转换为 Markdown:
Tool: convert_pdf_to_markdown
Input: {"file_path": "/Users/me/documents/whitepaper.pdf"}
Output: {"markdown": "# whitepaper.pdf\n\n---\n## Page 1\n\n### Introduction\n\nThis paper presents...", "char_count": 15200}提取表格:
Tool: extract_tables
Input: {"file_path": "/Users/me/documents/financials.pdf", "page_num": 3}
Output: {"tables_found": 2, "tables": [{"header": ["Quarter", "Revenue", "Profit"], "rows": [["Q1", "$1.2M", "$400K"], ...]}]}合并多个 PDF:
Tool: merge_pdfs
Input: {"file_paths": ["/tmp/part1.pdf", "/tmp/part2.pdf", "/tmp/part3.pdf"], "output_path": "/tmp/combined.pdf"}
Output: {"output": "/tmp/combined.pdf", "total_pages": 28}总结文档:
Tool: summarize_document
Input: {"file_path": "/Users/me/documents/thesis.pdf"}
Output: {"statistics": {"total_pages": 45, "total_words": 12500, "total_images": 8}, "headings": [...], "metadata": {"author": "...", "title": "..."}}定价
层级 | 限制 | 价格 |
免费版 | 20 次调用/天 | $0 |
专业版 | 无限制 + OCR 支持 + 批量处理 | $9/月 |
企业版 | 定制 + 优先支持 | 联系我们 |
许可证
MIT
This server cannot be installed
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/CSOAI-ORG/pdf-document-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server