MCP PDF Server

by DeepSeekMine

Integrations

  • Enables reading and processing PDF files with tools for text extraction, OCR recognition, and image extraction from PDF documents.

  • Based on FastMCP framework which is hosted on GitHub, allowing users to leverage the MCP protocol implementation for PDF processing.

  • Requires Python 3.9+ environment to run the server, utilizing Python libraries like PyMuPDF for PDF processing functionality.

Servidor PDF MCP

Un servidor de lectura de archivos PDF basado en FastMCP .

Admite extracción de texto PDF, reconocimiento OCR y extracción de imágenes a través del protocolo MCP, con un depurador web integrado para realizar pruebas fácilmente.


🚀 Características

  • leer_texto_pdf
    Extrae texto normal de un PDF (página por página).
  • leído por ocr
    Utiliza OCR para reconocer texto de archivos PDF escaneados o basados en imágenes.
  • leer imágenes en pdf
    Extrae todas las imágenes de una página PDF específica (salida codificada en Base64).

📂 Estructura del proyecto

mcp-pdf-server/ ├── pdf_resources/ # Directory for uploaded and processed PDF files ├── txt_server.py # Main server entry point └── README.md # Project documentation

⚙️ Instalación

Versión de Python recomendada: 3.9+

pip install pymupdf mcp

Nota: Para utilizar las funciones de OCR, es posible que necesite una compilación de MuPDF con soporte de OCR o bibliotecas de OCR externas.


🔦 Iniciar el servidor

Ejecute el siguiente comando:

python txt_server.py

Deberías ver registros como:

Serving on http://127.0.0.1:6231

Interfaz de depuración web

Abra su navegador y visite:

http://127.0.0.1:6231
  • Seleccione una herramienta del panel izquierdo
  • Complete los parámetros en el panel derecho
  • Haga clic en "Ejecutar" para probar la herramienta

No requiere codificación: depure y pruebe fácilmente a través de la interfaz de usuario web.


🛠️ Lista de herramientas API

HerramientaDescripciónParámetros de entradaDevoluciones
read_pdf_textExtrae texto normal de páginas PDFfile_path , start_page , end_pageLista de textos de páginas
read_by_ocrReconoce texto mediante OCRfile_path , start_page , end_page , language , dpiTexto extraído mediante OCR
read_pdf_imagesExtrae imágenes de una página PDFfile_path , page_numberLista de imágenes (codificadas en Base64)

📝 Ejemplo de uso

Extraer texto de las páginas 1 a 5:

mcp run read_pdf_text --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 5}'

Realizar reconocimiento OCR en la página 1:

mcp run read_by_ocr --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 1, "language": "eng"}'

Extraer todas las imágenes de la página 3:

mcp run read_pdf_images --args '{"file_path": "pdf_resources/example.pdf", "page_number": 3}'

📢 Notas

  • Los archivos deben colocarse dentro del directorio pdf_resources/ o se debe proporcionar una ruta absoluta.
  • La funcionalidad de OCR requiere soporte de OCR adecuado en el entorno.
  • Al procesar archivos grandes, ajuste la configuración de memoria y tiempo de espera según sea necesario.

📜 Licencia

Este proyecto está licenciado bajo la licencia MIT.
Para uso comercial, por favor dé crédito a la fuente original.


-
security - not tested
F
license - not found
-
quality - not tested

Un servidor de procesamiento de PDF que extrae texto mediante análisis normal u OCR y recupera imágenes de archivos PDF a través del protocolo MCP con un depurador web integrado.

  1. 🚀 Características
    1. 📂 Estructura del proyecto
      1. ⚙️ Instalación
        1. 🔦 Iniciar el servidor
          1. Interfaz de depuración web
            1. 🛠️ Lista de herramientas API
              1. 📝 Ejemplo de uso
                1. 📢 Notas
                  1. 📜 Licencia

                    Related MCP Servers

                    • A
                      security
                      F
                      license
                      A
                      quality
                      An MCP server for converting Markdown documents to PDF files.
                      Last updated -
                      1
                      1
                      JavaScript
                    • -
                      security
                      F
                      license
                      -
                      quality
                      Provides tools for reading and extracting text from PDF files, supporting both local files and URLs.
                      Last updated -
                      3
                      Python
                    • -
                      security
                      F
                      license
                      -
                      quality
                      A server providing PDF form manipulation tools via MCP's API, allowing users to find PDFs across directories, extract form field information, and visualize form fields in documents.
                      Last updated -
                      Python
                    • A
                      security
                      F
                      license
                      A
                      quality
                      A Model Context Protocol server that converts PDF documents into PNG images through a simple MCP tool call.
                      Last updated -
                      1
                      2
                      Python
                      • Apple
                      • Linux

                    View all related MCP servers

                    ID: i94bnr2e9s