PDF Document MCP Server
MCP-сервер для PDF-документов
От MEOK AI Labs | meok.ai
Инструментарий обработки документов для ИИ-агентов. Извлекайте текст, преобразуйте в Markdown, объединяйте PDF-файлы, извлекайте таблицы и создавайте сводки — всё локально, без зависимости от внешних API.
Инструменты
Инструмент | Описание |
| Извлечение текста из всех или указанных страниц PDF |
| Преобразование PDF в структурированный Markdown с определением заголовков |
| Объединение нескольких PDF-файлов в один документ |
| Извлечение табличных структур со страницы PDF с использованием анализа позиционирования |
| Создание метаданных, статистики, заголовков и сводок по страницам |
Установка
pip install mcp PyMuPDFНе требуются внешние сервисы, ключи API или облачные зависимости. Вся обработка происходит локально.
Использование
Запуск сервера
python server.pyКонфигурация Claude Desktop
{
"mcpServers": {
"pdf-document": {
"command": "python",
"args": ["/path/to/pdf-document-mcp/server.py"]
}
}
}Примеры вызовов
Извлечение текста из PDF:
Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf"}
Output: {"total_pages": 12, "total_characters": 48320, "pages": [{"page": 1, "text": "...", "char_count": 4210}, ...]}Извлечение только определенных страниц:
Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf", "pages": [1, 3, 5]}
Output: {"extracted_pages": 3, "pages": [...]}Преобразование PDF в Markdown:
Tool: convert_pdf_to_markdown
Input: {"file_path": "/Users/me/documents/whitepaper.pdf"}
Output: {"markdown": "# whitepaper.pdf\n\n---\n## Page 1\n\n### Introduction\n\nThis paper presents...", "char_count": 15200}Извлечение таблиц:
Tool: extract_tables
Input: {"file_path": "/Users/me/documents/financials.pdf", "page_num": 3}
Output: {"tables_found": 2, "tables": [{"header": ["Quarter", "Revenue", "Profit"], "rows": [["Q1", "$1.2M", "$400K"], ...]}]}Объединение нескольких PDF:
Tool: merge_pdfs
Input: {"file_paths": ["/tmp/part1.pdf", "/tmp/part2.pdf", "/tmp/part3.pdf"], "output_path": "/tmp/combined.pdf"}
Output: {"output": "/tmp/combined.pdf", "total_pages": 28}Создание сводки документа:
Tool: summarize_document
Input: {"file_path": "/Users/me/documents/thesis.pdf"}
Output: {"statistics": {"total_pages": 45, "total_words": 12500, "total_images": 8}, "headings": [...], "metadata": {"author": "...", "title": "..."}}Тарифы
Уровень | Лимит | Цена |
Free | 20 вызовов/день | $0 |
Pro | Безлимит + поддержка OCR + пакетная обработка | $9/мес |
Enterprise | Индивидуально + приоритетная поддержка | Свяжитесь с нами |
Лицензия
MIT
This server cannot be installed
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/CSOAI-ORG/pdf-document-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server