Servidor MCP del procesador PDF
Un servidor de Protocolo de Contexto de Modelo (MCP) para procesar documentos PDF con funciones avanzadas, como la extracción de ecuaciones LaTeX. Este servidor permite a Claude obtener, procesar y extraer información de documentos PDF, incluyendo ecuaciones matemáticas LaTeX.
Características
Obtención de PDF desde URL
Extracción de texto de archivos PDF
Reconocimiento y extracción de ecuaciones LaTeX
Integración con Claude a través de MCP
Instalación
Instalación estándar
Instalación para Claude Desktop/Claude Code
Para utilizar este servidor MCP con Claude Desktop o Claude Code:
Instale las herramientas CLI de MCP si aún no están instaladas:
pip install "mcp[cli]"Instale el servidor utilizando la herramienta CLI de MCP:
mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorPor ejemplo, si ha clonado este repositorio en
~/mcp_pdf_processor
:mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processorPara el desarrollo con el Inspector MCP:
mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorEn Claude Desktop, ahora puedes usar el servidor PDF_TOOLS en tus conversaciones con estos comandos:
/mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>
Uso
Ejecución independiente
Variables de entorno
OUTPUT_DIR
: Directorio para almacenar los PDF procesados (predeterminado:llm_output
)PYTHONPATH
: Establezca el directorio que contiene el paquete mcp_pdf_processor
Usando con Claude
Cuando el servidor esté registrado, puedes pedirle a Claude que:
"Obtener y analizar el PDF en [URL]"
Extraer ecuaciones LaTeX del PDF en [URL]
"Resumir el contenido del PDF en [URL]"
Requisitos
El servidor requiere las siguientes dependencias principales:
Python 3.9 o superior
pymupdf
: procesamiento de PDF y extracción de textomcp
: Compatibilidad con el protocolo de contexto de modelopydantic
: Validación y serialización de datosaiohttp
: Cliente/servidor HTTP asíncronotorch
: Para extracción de ecuaciones LaTeX (opcional)pix2tex
: Para reconocimiento de ecuaciones LaTeX (opcional)
Consulte pyproject.toml
para obtener la lista completa de dependencias y requisitos de versión.
Ejemplos de uso
A continuación se muestra un ejemplo completo de flujo de trabajo para utilizar el procesador de PDF con Claude Desktop:
Licencia
Instituto Tecnológico de Massachusetts (MIT)
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Un servidor de protocolo de contexto de modelo que permite a Claude obtener, procesar y extraer información de documentos PDF, incluidas ecuaciones matemáticas LaTeX.
Related MCP Servers
- AsecurityAlicenseAqualityModel Context Protocol server that enables Claude Desktop (or any MCP client) to fetch web content and process images appropriately.Last updated -1106MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables Claude to perform web research by integrating Google search, extracting webpage content, and capturing screenshots.Last updated -315,70416MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables Claude to perform advanced web research with intelligent search queuing, enhanced content extraction, and deep research capabilities.Last updated -391MIT License
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server that enables Claude or other LLMs to fetch content from URLs, supporting HTML, JSON, text, and images with configurable request parameters.Last updated -32MIT License