PDF Processor MCP Server
Servidor MCP del procesador PDF
Un servidor de Protocolo de Contexto de Modelo (MCP) para procesar documentos PDF con funciones avanzadas, como la extracción de ecuaciones LaTeX. Este servidor permite a Claude obtener, procesar y extraer información de documentos PDF, incluyendo ecuaciones matemáticas LaTeX.
Características
Obtención de PDF desde URL
Extracción de texto de archivos PDF
Reconocimiento y extracción de ecuaciones LaTeX
Integración con Claude a través de MCP
Related MCP server: MCP Web Research Server
Instalación
Instalación estándar
pip install -e .Instalación para Claude Desktop/Claude Code
Para utilizar este servidor MCP con Claude Desktop o Claude Code:
Instale las herramientas CLI de MCP si aún no están instaladas:
pip install "mcp[cli]"Instale el servidor utilizando la herramienta CLI de MCP:
mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorPor ejemplo, si ha clonado este repositorio en
~/mcp_pdf_processor:mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processorPara el desarrollo con el Inspector MCP:
mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorEn Claude Desktop, ahora puedes usar el servidor PDF_TOOLS en tus conversaciones con estos comandos:
/mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>
Uso
Ejecución independiente
python pdf_tool_server.pyVariables de entorno
OUTPUT_DIR: Directorio para almacenar los PDF procesados (predeterminado:llm_output)PYTHONPATH: Establezca el directorio que contiene el paquete mcp_pdf_processor
Usando con Claude
Cuando el servidor esté registrado, puedes pedirle a Claude que:
"Obtener y analizar el PDF en [URL]"
Extraer ecuaciones LaTeX del PDF en [URL]
"Resumir el contenido del PDF en [URL]"
Requisitos
El servidor requiere las siguientes dependencias principales:
Python 3.9 o superior
pymupdf: procesamiento de PDF y extracción de textomcp: Compatibilidad con el protocolo de contexto de modelopydantic: Validación y serialización de datosaiohttp: Cliente/servidor HTTP asíncronotorch: Para extracción de ecuaciones LaTeX (opcional)pix2tex: Para reconocimiento de ecuaciones LaTeX (opcional)
Consulte pyproject.toml para obtener la lista completa de dependencias y requisitos de versión.
Ejemplos de uso
A continuación se muestra un ejemplo completo de flujo de trabajo para utilizar el procesador de PDF con Claude Desktop:
# 1. Fetch a PDF without reading it
/mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522
# This returns a hash_id, which you'll use in the next step
# 2. Process the PDF with LaTeX extraction
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true
# This returns a filename for the processed output
# 3. Read the processed content
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>
# Now Claude can analyze the PDF content, including any LaTeX equationsLicencia
Instituto Tecnológico de Massachusetts (MIT)
This server cannot be installed
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/MichaelLevinson/mcp_pdf_processor'
If you have feedback or need assistance with the MCP directory API, please join our Discord server