Skip to main content
Glama

PDF Reader MCP Server

by trafflux

Servidor MCP del lector de PDF

Un servidor de Protocolo de Contexto de Modelo (MCP) que proporciona herramientas para leer y extraer texto de archivos PDF, admitiendo tanto archivos locales como URL.

Autor

Philip Van de Walker
Correo electrónico: philip.vandewalker@gmail.com
GitHub: https://github.com/trafflux

Características

  • Leer contenido de texto de archivos PDF locales
  • Leer contenido de texto de URLs de PDF
  • Manejo de errores para archivos PDF corruptos o no válidos
  • Montaje de volumen para acceder a archivos PDF locales
  • Detección automática de codificación PDF
  • Formato de salida JSON estandarizado

Instalación

  1. Clonar el repositorio:
git clone https://github.com/trafflux/pdf-reader-mcp.git cd pdf-reader-mcp
  1. Construya la imagen de Docker:
docker build -t mcp/pdf-reader .

Uso

Ejecución del servidor

Para ejecutar el servidor con acceso a archivos PDF locales:

docker run -i --rm -v /path/to/pdfs:/pdfs mcp/pdf-reader

Reemplace /path/to/pdfs con la ruta real a su directorio de archivos PDF.

Si no utiliza archivos PDF locales:

docker run -i --rm mcp/pdf-reader

Configuración de MCP

Añade a tu configuración de MCP:

{ "mcpServers": { "pdf-reader": { "command": "docker", "args": [ "run", "-i", "--rm", "-v", "/path/to/pdfs:/pdfs", "mcp/pdf-reader" ], "disabled": false, "autoApprove": [] } } }

Sin archivos PDF de archivo local:

{ "mcpServers": { "pdf-reader": { "command": "docker", "args": ["run", "-i", "--rm", "mcp/pdf-reader"], "disabled": false, "autoApprove": [] } } }

Herramientas disponibles

  1. read_local_pdf
    • Propósito: Leer el contenido de texto de un archivo PDF local
    • Aporte:
      { "path": "/pdfs/document.pdf" }
    • Producción:
      { "success": true, "data": { "text": "Extracted content..." } }
  2. read_pdf_url
    • Propósito: Leer el contenido de texto de una URL PDF
    • Aporte:
      { "url": "https://example.com/document.pdf" }
    • Producción:
      { "success": true, "data": { "text": "Extracted content..." } }

Manejo de errores

El servidor maneja varios casos de error con mensajes de error claros:

  • Archivos PDF no válidos o corruptos
  • Archivos faltantes
  • Solicitudes de URL fallidas
  • Problemas de permisos
  • Problemas de conectividad de red

Las respuestas de error siguen el formato:

{ "success": false, "error": "Detailed error message" }

Dependencias

  • Python 3.11+
  • PyPDF2: análisis de PDF y extracción de texto
  • solicitudes: cliente HTTP para obtener archivos PDF de URL
  • SDK de MCP: Implementación del protocolo de contexto del modelo

Estructura del proyecto

. ├── Dockerfile # Container configuration ├── README.md # This documentation ├── requirements.txt # Python dependencies └── src/ ├── __init__.py # Package initialization └── server.py # Main server implementation

Licencia

Copyright 2025 Philip Van de Walker

Con licencia Apache, versión 2.0 (la «Licencia»); no puede usar este archivo excepto de conformidad con la Licencia. Puede obtener una copia de la Licencia en

http://www.apache.org/licenses/LICENSE-2.0

Salvo que la legislación aplicable lo exija o se acuerde por escrito, el software distribuido bajo la Licencia se distribuye "TAL CUAL", SIN GARANTÍAS NI CONDICIONES DE NINGÚN TIPO, ni expresas ni implícitas. Consulte la Licencia para conocer el texto específico que rige los permisos y limitaciones de la misma.

Contribuyendo

¡Agradecemos sus contribuciones! No dude en enviar una solicitud de incorporación de cambios.

Contacto

Si tiene preguntas, problemas o contribuciones, comuníquese con Philip Van de Walker:

-
security - not tested
F
license - not found
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Proporciona herramientas para leer y extraer texto de archivos PDF, admitiendo tanto archivos locales como URL.

  1. Autor
    1. Características
      1. Instalación
        1. Uso
          1. Ejecución del servidor
          2. Configuración de MCP
          3. Herramientas disponibles
        2. Manejo de errores
          1. Dependencias
            1. Estructura del proyecto
              1. Licencia
                1. Contribuyendo
                  1. Contacto

                    Related MCP Servers

                    • A
                      security
                      A
                      license
                      A
                      quality
                      Enables text extraction from web pages and PDFs, and execution of predefined commands, enhancing content processing and automation capabilities.
                      Last updated -
                      3
                      TypeScript
                      MIT License
                    • A
                      security
                      A
                      license
                      A
                      quality
                      Provides comprehensive document processing, including reading, converting, and manipulating various document formats with advanced text and HTML processing capabilities.
                      Last updated -
                      16
                      231
                      11
                      TypeScript
                      MIT License
                    • -
                      security
                      F
                      license
                      -
                      quality
                      A server providing PDF form manipulation tools via MCP's API, allowing users to find PDFs across directories, extract form field information, and visualize form fields in documents.
                      Last updated -
                      Python
                    • A
                      security
                      F
                      license
                      A
                      quality
                      An MCP server that provides a tool to extract text content from local PDF files, supporting both standard PDF reading and OCR capabilities with optional page selection.
                      Last updated -
                      1
                      6
                      Python
                      • Apple

                    View all related MCP servers

                    MCP directory API

                    We provide all the information about MCP servers via our MCP API.

                    curl -X GET 'https://glama.ai/api/mcp/v1/servers/trafflux/pdf-reader-mcp'

                    If you have feedback or need assistance with the MCP directory API, please join our Discord server