Skip to main content
Glama

MCP-сервер для PDF-документов

От MEOK AI Labs | meok.ai

Инструментарий обработки документов для ИИ-агентов. Извлекайте текст, преобразуйте в Markdown, объединяйте PDF-файлы, извлекайте таблицы и создавайте сводки — всё локально, без зависимости от внешних API.

Инструменты

Инструмент

Описание

extract_text_from_pdf

Извлечение текста из всех или указанных страниц PDF

convert_pdf_to_markdown

Преобразование PDF в структурированный Markdown с определением заголовков

merge_pdfs

Объединение нескольких PDF-файлов в один документ

extract_tables

Извлечение табличных структур со страницы PDF с использованием анализа позиционирования

summarize_document

Создание метаданных, статистики, заголовков и сводок по страницам

Установка

pip install mcp PyMuPDF

Не требуются внешние сервисы, ключи API или облачные зависимости. Вся обработка происходит локально.

Использование

Запуск сервера

python server.py

Конфигурация Claude Desktop

{
  "mcpServers": {
    "pdf-document": {
      "command": "python",
      "args": ["/path/to/pdf-document-mcp/server.py"]
    }
  }
}

Примеры вызовов

Извлечение текста из PDF:

Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf"}
Output: {"total_pages": 12, "total_characters": 48320, "pages": [{"page": 1, "text": "...", "char_count": 4210}, ...]}

Извлечение только определенных страниц:

Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf", "pages": [1, 3, 5]}
Output: {"extracted_pages": 3, "pages": [...]}

Преобразование PDF в Markdown:

Tool: convert_pdf_to_markdown
Input: {"file_path": "/Users/me/documents/whitepaper.pdf"}
Output: {"markdown": "# whitepaper.pdf\n\n---\n## Page 1\n\n### Introduction\n\nThis paper presents...", "char_count": 15200}

Извлечение таблиц:

Tool: extract_tables
Input: {"file_path": "/Users/me/documents/financials.pdf", "page_num": 3}
Output: {"tables_found": 2, "tables": [{"header": ["Quarter", "Revenue", "Profit"], "rows": [["Q1", "$1.2M", "$400K"], ...]}]}

Объединение нескольких PDF:

Tool: merge_pdfs
Input: {"file_paths": ["/tmp/part1.pdf", "/tmp/part2.pdf", "/tmp/part3.pdf"], "output_path": "/tmp/combined.pdf"}
Output: {"output": "/tmp/combined.pdf", "total_pages": 28}

Создание сводки документа:

Tool: summarize_document
Input: {"file_path": "/Users/me/documents/thesis.pdf"}
Output: {"statistics": {"total_pages": 45, "total_words": 12500, "total_images": 8}, "headings": [...], "metadata": {"author": "...", "title": "..."}}

Тарифы

Уровень

Лимит

Цена

Free

20 вызовов/день

$0

Pro

Безлимит + поддержка OCR + пакетная обработка

$9/мес

Enterprise

Индивидуально + приоритетная поддержка

Свяжитесь с нами

Лицензия

MIT

-
security - not tested
F
license - not found
-
quality - not tested

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/CSOAI-ORG/pdf-document-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server