Servidor MCP del procesador PDF

Un servidor de Protocolo de Contexto de Modelo (MCP) para procesar documentos PDF con funciones avanzadas, como la extracción de ecuaciones LaTeX. Este servidor permite a Claude obtener, procesar y extraer información de documentos PDF, incluyendo ecuaciones matemáticas LaTeX.

Características

Obtención de PDF desde URL
Extracción de texto de archivos PDF
Reconocimiento y extracción de ecuaciones LaTeX
Integración con Claude a través de MCP

Related MCP server: MCP Web Research Server

Instalación

Instalación estándar

pip install -e .

Instalación para Claude Desktop/Claude Code

Para utilizar este servidor MCP con Claude Desktop o Claude Code:

Instale las herramientas CLI de MCP si aún no están instaladas:
```
pip install "mcp[cli]"
```

Instale el servidor utilizando la herramienta CLI de MCP:

mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor

Por ejemplo, si ha clonado este repositorio en ~/mcp_pdf_processor :

mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor

Para el desarrollo con el Inspector MCP:

mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor

En Claude Desktop, ahora puedes usar el servidor PDF_TOOLS en tus conversaciones con estos comandos:

/mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

Uso

Ejecución independiente

python pdf_tool_server.py

Variables de entorno

OUTPUT_DIR : Directorio para almacenar los PDF procesados (predeterminado: llm_output )
PYTHONPATH : Establezca el directorio que contiene el paquete mcp_pdf_processor

Usando con Claude

Cuando el servidor esté registrado, puedes pedirle a Claude que:

"Obtener y analizar el PDF en [URL]"
Extraer ecuaciones LaTeX del PDF en [URL]
"Resumir el contenido del PDF en [URL]"

Requisitos

El servidor requiere las siguientes dependencias principales:

Python 3.9 o superior
pymupdf : procesamiento de PDF y extracción de texto
mcp : Compatibilidad con el protocolo de contexto de modelo
pydantic : Validación y serialización de datos
aiohttp : Cliente/servidor HTTP asíncrono
torch : Para extracción de ecuaciones LaTeX (opcional)
pix2tex : Para reconocimiento de ecuaciones LaTeX (opcional)

Consulte pyproject.toml para obtener la lista completa de dependencias y requisitos de versión.

Ejemplos de uso

A continuación se muestra un ejemplo completo de flujo de trabajo para utilizar el procesador de PDF con Claude Desktop:

# 1. Fetch a PDF without reading it
/mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522

# This returns a hash_id, which you'll use in the next step

# 2. Process the PDF with LaTeX extraction
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true

# This returns a filename for the processed output

# 3. Read the processed content
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

# Now Claude can analyze the PDF content, including any LaTeX equations

Licencia

Instituto Tecnológico de Massachusetts (MIT)

This server cannot be installed

A

license - permissive license

-

quality - not tested

C

maintenance

How are these scores calculated?

Resources

GitHub Repository

Need Help?

Related Servers

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

PDF Processor MCP Server