PDF Processor MCP Server

Integrations

  • Supports recognition and extraction of LaTeX mathematical equations from PDF documents

Servidor MCP del procesador PDF

Un servidor de Protocolo de Contexto de Modelo (MCP) para procesar documentos PDF con funciones avanzadas, como la extracción de ecuaciones LaTeX. Este servidor permite a Claude obtener, procesar y extraer información de documentos PDF, incluyendo ecuaciones matemáticas LaTeX.

Características

  • Obtención de PDF desde URL
  • Extracción de texto de archivos PDF
  • Reconocimiento y extracción de ecuaciones LaTeX
  • Integración con Claude a través de MCP

Instalación

Instalación estándar

pip install -e .

Instalación para Claude Desktop/Claude Code

Para utilizar este servidor MCP con Claude Desktop o Claude Code:

  1. Instale las herramientas CLI de MCP si aún no están instaladas:
    pip install "mcp[cli]"
  2. Instale el servidor utilizando la herramienta CLI de MCP:
    mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
    Por ejemplo, si ha clonado este repositorio en ~/mcp_pdf_processor :
    mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor
  3. Para el desarrollo con el Inspector MCP:
    mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
  4. En Claude Desktop, ahora puedes usar el servidor PDF_TOOLS en tus conversaciones con estos comandos:
    /mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

Uso

Ejecución independiente

python pdf_tool_server.py

Variables de entorno

  • OUTPUT_DIR : Directorio para almacenar los PDF procesados (predeterminado: llm_output )
  • PYTHONPATH : Establezca el directorio que contiene el paquete mcp_pdf_processor

Usando con Claude

Cuando el servidor esté registrado, puedes pedirle a Claude que:

  • "Obtener y analizar el PDF en [URL]"
  • Extraer ecuaciones LaTeX del PDF en [URL]
  • "Resumir el contenido del PDF en [URL]"

Requisitos

El servidor requiere las siguientes dependencias principales:

  • Python 3.9 o superior
  • pymupdf : procesamiento de PDF y extracción de texto
  • mcp : Compatibilidad con el protocolo de contexto de modelo
  • pydantic : Validación y serialización de datos
  • aiohttp : Cliente/servidor HTTP asíncrono
  • torch : Para extracción de ecuaciones LaTeX (opcional)
  • pix2tex : Para reconocimiento de ecuaciones LaTeX (opcional)

Consulte pyproject.toml para obtener la lista completa de dependencias y requisitos de versión.

Ejemplos de uso

A continuación se muestra un ejemplo completo de flujo de trabajo para utilizar el procesador de PDF con Claude Desktop:

# 1. Fetch a PDF without reading it /mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522 # This returns a hash_id, which you'll use in the next step # 2. Process the PDF with LaTeX extraction /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true # This returns a filename for the processed output # 3. Read the processed content /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME> # Now Claude can analyze the PDF content, including any LaTeX equations

Licencia

Instituto Tecnológico de Massachusetts (MIT)

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Un servidor de protocolo de contexto de modelo que permite a Claude obtener, procesar y extraer información de documentos PDF, incluidas ecuaciones matemáticas LaTeX.

  1. Características
    1. Instalación
      1. Instalación estándar
      2. Instalación para Claude Desktop/Claude Code
    2. Uso
      1. Ejecución independiente
      2. Variables de entorno
      3. Usando con Claude
    3. Requisitos
      1. Ejemplos de uso
        1. Licencia

          Related MCP Servers

          • -
            security
            A
            license
            -
            quality
            A Model Context Protocol server that allows Claude to create flashcards for Rember, helping users study and remember information through spaced repetition reviews.
            Last updated -
            88
            16
            TypeScript
            MIT License
          • -
            security
            A
            license
            -
            quality
            A Model Context Protocol server that integrates Claude with Blender, enabling users to analyze and interact with IFC (Industry Foundation Classes) building models through natural language commands.
            Last updated -
            5
            Python
            MIT License
            • Apple
          • -
            security
            F
            license
            -
            quality
            A Model Context Protocol server that allows Claude Desktop to perform document operations on Microsoft Word, Excel, and PDF files including creation, editing, and format conversion.
            Last updated -
            9
            Python
            • Apple
          • -
            security
            -
            license
            -
            quality
            A Model Context Protocol (MCP) server that converts LaTeX mathematical expressions to MathML format.
            Last updated -
            3
            JavaScript
            MIT License

          View all related MCP servers

          ID: nvzs48ghlz