MCP PDF Server

by Dev-91

Integrations

  • Offers containerized deployment of the PDF server, with volume mounting capabilities to access and manage PDF files between host and container

  • Provides a web interface for managing PDF files, allowing users to upload, download, and view PDF files through a FastAPI-based web UI

MCP PDF Server

MCP PDF Server ist ein auf Model Context Protocol (MCP) basierender Server, der PDF-Dateien effizient verwalten kann.

Dieses Projekt wurde erstellt, um mir als Embedded-Entwickler das Lesen und Zusammenfassen von PDF-Datenblattdokumenten direkt in KI-Codierungstools wie Cursor oder die Durchführung von Fragen und Antworten zu erleichtern und so die Entwicklungsarbeit komfortabler zu gestalten. Mit anderen Worten besteht der Hauptzweck darin, KI dabei zu unterstützen, den Inhalt von PDF-Datenblättern schnell zu verstehen und die erforderlichen Informationen sofort bereitzustellen.

Dieses Projekt besteht aus zwei Hauptkomponenten:

  • manager_server : Eine auf FastAPI basierende Webseite, die Benutzern die Möglichkeit bietet, PDF-Dateien hoch- oder herunterzuladen und Dateilisten über eine Web-Benutzeroberfläche anzuzeigen und zu verwalten. Es bietet außerdem eine RESTful-API für die Integration mit externen Systemen.
  • mcp_server : Bietet Dateinamensuche und Textextraktionsfunktionen basierend auf PDF-Dateien, die vom Manager-Server verwaltet werden. Extrahierter Text kann über das MCP-Protokoll mit externen Systemen (z. B. Cursor usw.) verknüpft werden.

Hauptmerkmale:

  • PDF-Text extrahieren (unterstützt lokale Dateien und URLs)
  • PDF-Suche basierend auf dem Dateinamen
  • Anzeigen und Verwalten von PDF-Listen
  • Unterstützt das Hoch- und Herunterladen von PDF-Dateien über das Internet
  • Bereitstellung von RESTful-APIs und Webdiensten
  • Konnektivität zu externen Systemen (Curator, Cursor usw.) über das MCP-Protokoll

Es lässt sich problemlos über RESTful API und Web-UI in externe Systeme integrieren und sowohl in Docker- als auch in lokalen Umgebungen problemlos bereitstellen und betreiben. Geeignet für die automatisierte Verwaltung und den Abruf verschiedener PDF-Dokumente wie Datenblätter, Papiere und Verträge.

Hauptmerkmale

  • Extrahieren Sie Text aus lokalen PDF-Dateien und über eine URL zugänglichen PDFs
  • Bietet eine Liste von PDF-Dateien unter /app/datasheets
  • Bietet eine PDF-Suchfunktion nach Dateinamen
  • Zuverlässige Textextraktion und Ausnahmebehandlung basierend auf PyPDF2
  • Bereitstellung standardisierter MCP-Tools auf Basis von FastMCP

Ausführen mit Docker

  1. Image erstellen
    docker build -t mcp-pdf-server:1.0.0 .
  2. Ausführen eines Containers
    docker run -d \ -v /호스트/경로/데이터:/app/datasheets \ -p 5050:5050 \ -p 5080:5080 \ --name mcp-pdf-server \ mcp-pdf-server:1.0.0
    • Wenn Sie eine PDF-Datei in /호스트/경로/데이터 können Sie innerhalb des Containers von /app/datasheets darauf zugreifen.
    • Es werden die Ports 5050 und 5080 verwendet.
  3. Bei Verwendung von Docker-Compose
    # docker-compose.yml의 /path/to/your/datasheets를 실제 PDF 폴더 경로로 수정하세요. docker-compose up -d --build

Direktes lokales Ausführen (Python)

  1. Installieren von Abhängigkeiten
    pip install -r requirements.txt
  2. Ausführen des Servers
    python mcp_server/mcp_pdf_server.py # 또는 uvicorn manager_server.main:app --host 0.0.0.0 --port 5080

Beschreibung des MCP-Tools (API)

  • lokales PDF lesen
    Extrahieren Sie Text, indem Sie einen lokalen PDF-Dateipfad eingeben.
  • PDF-Datei lesen
    Geben Sie die URL einer PDF-Datei ein und extrahieren Sie den Text daraus.
  • server_pdf_list
    Gibt eine Liste aller PDF-Dateien unter /app/datasheets zurück.
  • server_pdf_search
    Geben Sie einen Dateinamen ein, suchen Sie auf dem Server nach einer PDF-Datei und extrahieren Sie den Text aus dieser PDF-Datei.

Routenführung

  • PDF-Daten müssen sich im Pfad /app/datasheets (innerhalb des Docker-Containers) befinden.
  • Wenn Sie Docker verwenden, mounten Sie den PDF-Ordner des Hosts in /app/datasheets .
  • Der Quellcode befindet sich in /app/mcp_server (innerhalb des Containers).

Lizenz

Apache-Lizenz 2.0
Autor: Dev91

-
security - not tested
A
license - permissive license
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Ein auf dem Model Context Protocol (MCP) basierender Server, der PDF-Dateien effizient verwaltet und es KI-Codierungstools wie Cursor ermöglicht, Informationen aus PDF-Datenblättern zu lesen, zusammenzufassen und zu extrahieren, um die eingebettete Entwicklungsarbeit zu unterstützen.

  1. Hauptmerkmale
    1. Ausführen mit Docker
      1. Direktes lokales Ausführen (Python)
        1. Beschreibung des MCP-Tools (API)
          1. Routenführung
            1. Lizenz

              Related MCP Servers

              • A
                security
                F
                license
                A
                quality
                A Model Context Protocol server that converts PDF documents into PNG images through a simple MCP tool call.
                Last updated -
                1
                2
                Python
                • Apple
                • Linux
              • -
                security
                F
                license
                -
                quality
                Implements the Model Context Protocol (MCP) to provide AI models with a standardized interface for connecting to external data sources and tools like file systems, databases, or APIs.
                Last updated -
                90
                Python
                • Apple
                • Linux
              • -
                security
                A
                license
                -
                quality
                A Model Context Protocol (MCP) server that allows AI models to safely access and interact with local file systems, enabling reading file contents, listing directories, and retrieving file metadata.
                Last updated -
                47
                1
                JavaScript
                MIT License
                • Linux
              • -
                security
                -
                license
                -
                quality
                A Model Context Protocol (MCP) server that allows interaction with PDF and EPUB documents, designed to work with Windsurf IDE by Codeium.
                Last updated -
                3
                Python
                MIT License

              View all related MCP servers

              ID: szpn5w5z6a