Skip to main content
Glama

PDF Processor MCP Server

PDF-процессор MCP-сервер

Сервер Model Context Protocol (MCP) для обработки PDF-документов с расширенными функциями, включая извлечение уравнений LaTeX. Этот сервер позволяет Клоду извлекать, обрабатывать и извлекать информацию из PDF-документов, включая математические уравнения LaTeX.

Функции

  • Извлечение PDF-файлов из URL-адресов
  • Извлечение текста из PDF-файлов
  • Распознавание и извлечение уравнений LaTeX
  • Интеграция с Клодом через MCP

Установка

Стандартная установка

pip install -e .

Установка для Claude Desktop/Claude Code

Чтобы использовать этот MCP-сервер с Claude Desktop или Claude Code:

  1. Установите инструменты MCP CLI, если они еще не установлены:
    pip install "mcp[cli]"
  2. Установите сервер с помощью инструмента MCP CLI:
    mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
    Например, если вы клонировали этот репозиторий в ~/mcp_pdf_processor :
    mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor
  3. Для разработки с помощью MCP Inspector:
    mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
  4. В Claude Desktop теперь вы можете использовать сервер PDF_TOOLS в своих диалогах с помощью следующих команд:
    /mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

Использование

Работает автономно

python pdf_tool_server.py

Переменные среды

  • OUTPUT_DIR : Каталог для хранения обработанных PDF-файлов (по умолчанию: llm_output )
  • PYTHONPATH : Укажите каталог, содержащий пакет mcp_pdf_processor

Использование с Клодом

После регистрации сервера вы можете попросить Клода:

  • «Загрузить и проанализировать PDF-файл по адресу [URL]»
  • «Извлечь уравнения LaTeX из PDF-файла по адресу [URL]»
  • «Кратко изложите содержание PDF-файла по адресу [URL]»

Требования

Для сервера требуются следующие основные зависимости:

  • Python 3.9 или выше
  • pymupdf : обработка PDF-файлов и извлечение текста
  • mcp : поддержка протокола контекста модели
  • pydantic : Проверка и сериализация данных
  • aiohttp : Асинхронный HTTP-клиент/сервер
  • torch : Для извлечения уравнений LaTeX (необязательно)
  • pix2tex : Для распознавания уравнений LaTeX (необязательно)

Полный список зависимостей и требований к версиям см. в pyproject.toml

Примеры использования

Вот полный пример рабочего процесса использования PDF-процессора с Claude Desktop:

# 1. Fetch a PDF without reading it /mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522 # This returns a hash_id, which you'll use in the next step # 2. Process the PDF with LaTeX extraction /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true # This returns a filename for the processed output # 3. Read the processed content /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME> # Now Claude can analyze the PDF content, including any LaTeX equations

Лицензия

Массачусетский технологический институт

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Сервер Model Context Protocol, позволяющий Клоду извлекать, обрабатывать и извлекать информацию из PDF-документов, включая математические уравнения LaTeX.

  1. Функции
    1. Установка
      1. Стандартная установка
      2. Установка для Claude Desktop/Claude Code
    2. Использование
      1. Работает автономно
      2. Переменные среды
      3. Использование с Клодом
    3. Требования
      1. Примеры использования
        1. Лицензия

          Related MCP Servers

          • -
            security
            A
            license
            -
            quality
            A Model Context Protocol server that allows Claude to create flashcards for Rember, helping users study and remember information through spaced repetition reviews.
            Last updated -
            88
            16
            TypeScript
            MIT License
          • -
            security
            A
            license
            -
            quality
            A Model Context Protocol server that integrates Claude with Blender, enabling users to analyze and interact with IFC (Industry Foundation Classes) building models through natural language commands.
            Last updated -
            9
            Python
            MIT License
            • Apple
          • -
            security
            F
            license
            -
            quality
            A Model Context Protocol server that allows Claude Desktop to perform document operations on Microsoft Word, Excel, and PDF files including creation, editing, and format conversion.
            Last updated -
            9
            Python
            • Apple
          • -
            security
            -
            license
            -
            quality
            A Model Context Protocol (MCP) server that converts LaTeX mathematical expressions to MathML format.
            Last updated -
            3
            JavaScript
            MIT License

          View all related MCP servers

          MCP directory API

          We provide all the information about MCP servers via our MCP API.

          curl -X GET 'https://glama.ai/api/mcp/v1/servers/MichaelLevinson/mcp_pdf_processor'

          If you have feedback or need assistance with the MCP directory API, please join our Discord server