MCP PDF Server

MCP PDF Server ist ein auf Model Context Protocol (MCP) basierender Server, der PDF-Dateien effizient verwalten kann.

Dieses Projekt wurde erstellt, um mir als Embedded-Entwickler das Lesen und Zusammenfassen von PDF-Datenblattdokumenten direkt in KI-Codierungstools wie Cursor oder die Durchführung von Fragen und Antworten zu erleichtern und so die Entwicklungsarbeit komfortabler zu gestalten. Mit anderen Worten besteht der Hauptzweck darin, KI dabei zu unterstützen, den Inhalt von PDF-Datenblättern schnell zu verstehen und die erforderlichen Informationen sofort bereitzustellen.

Dieses Projekt besteht aus zwei Hauptkomponenten:

manager_server : Eine auf FastAPI basierende Webseite, die Benutzern die Möglichkeit bietet, PDF-Dateien hoch- oder herunterzuladen und Dateilisten über eine Web-Benutzeroberfläche anzuzeigen und zu verwalten. Es bietet außerdem eine RESTful-API für die Integration mit externen Systemen.
mcp_server : Bietet Dateinamensuche und Textextraktionsfunktionen basierend auf PDF-Dateien, die vom Manager-Server verwaltet werden. Extrahierter Text kann über das MCP-Protokoll mit externen Systemen (z. B. Cursor usw.) verknüpft werden.

Hauptmerkmale:

PDF-Text extrahieren (unterstützt lokale Dateien und URLs)
PDF-Suche basierend auf dem Dateinamen
Anzeigen und Verwalten von PDF-Listen
Unterstützt das Hoch- und Herunterladen von PDF-Dateien über das Internet
Bereitstellung von RESTful-APIs und Webdiensten
Konnektivität zu externen Systemen (Curator, Cursor usw.) über das MCP-Protokoll

Es lässt sich problemlos über RESTful API und Web-UI in externe Systeme integrieren und sowohl in Docker- als auch in lokalen Umgebungen problemlos bereitstellen und betreiben. Geeignet für die automatisierte Verwaltung und den Abruf verschiedener PDF-Dokumente wie Datenblätter, Papiere und Verträge.

Hauptmerkmale

Extrahieren Sie Text aus lokalen PDF-Dateien und über eine URL zugänglichen PDFs
Bietet eine Liste von PDF-Dateien unter /app/datasheets
Bietet eine PDF-Suchfunktion nach Dateinamen
Zuverlässige Textextraktion und Ausnahmebehandlung basierend auf PyPDF2
Bereitstellung standardisierter MCP-Tools auf Basis von FastMCP

Related MCP server: File MCP Server

Ausführen mit Docker

Image erstellen
docker build -t mcp-pdf-server:1.0.0 .
Ausführen eines Containers
docker run -d \ -v /호스트/경로/데이터:/app/datasheets \ -p 5050:5050 \ -p 5080:5080 \ --name mcp-pdf-server \ mcp-pdf-server:1.0.0
- Wenn Sie eine PDF-Datei in /호스트/경로/데이터 können Sie innerhalb des Containers von /app/datasheets darauf zugreifen.
- Es werden die Ports 5050 und 5080 verwendet.
Bei Verwendung von Docker-Compose
# docker-compose.yml의 /path/to/your/datasheets를 실제 PDF 폴더 경로로 수정하세요. docker-compose up -d --build

Direktes lokales Ausführen (Python)

Installieren von Abhängigkeiten
pip install -r requirements.txt
Ausführen des Servers
python mcp_server/mcp_pdf_server.py # 또는 uvicorn manager_server.main:app --host 0.0.0.0 --port 5080

Beschreibung des MCP-Tools (API)

lokales PDF lesen
Extrahieren Sie Text, indem Sie einen lokalen PDF-Dateipfad eingeben.
PDF-Datei lesen
Geben Sie die URL einer PDF-Datei ein und extrahieren Sie den Text daraus.
server_pdf_list
Gibt eine Liste aller PDF-Dateien unter /app/datasheets zurück.
server_pdf_search
Geben Sie einen Dateinamen ein, suchen Sie auf dem Server nach einer PDF-Datei und extrahieren Sie den Text aus dieser PDF-Datei.

Routenführung

PDF-Daten müssen sich im Pfad /app/datasheets (innerhalb des Docker-Containers) befinden.
Wenn Sie Docker verwenden, mounten Sie den PDF-Ordner des Hosts in /app/datasheets .
Der Quellcode befindet sich in /app/mcp_server (innerhalb des Containers).