Skip to main content
Glama

PDF-Dokument-MCP-Server

Von MEOK AI Labs | meok.ai

Dokumentenverarbeitungs-Toolkit für KI-Agenten. Extrahieren Sie Text, konvertieren Sie in Markdown, führen Sie PDFs zusammen, extrahieren Sie Tabellen und fassen Sie Dokumente zusammen – alles lokal ohne externe API-Abhängigkeiten.

Tools

Tool

Beschreibung

extract_text_from_pdf

Extrahiert Text aus allen oder bestimmten Seiten eines PDFs

convert_pdf_to_markdown

Konvertiert PDF in strukturiertes Markdown mit Überschriftenerkennung

merge_pdfs

Führt mehrere PDF-Dateien zu einem einzigen Dokument zusammen

extract_tables

Extrahiert Tabellenstrukturen von einer PDF-Seite mittels Positionsanalyse

summarize_document

Generiert Metadaten, Statistiken, Überschriften und Zusammenfassungen pro Seite

Installation

pip install mcp PyMuPDF

Keine externen Dienste, API-Schlüssel oder Cloud-Abhängigkeiten erforderlich. Die gesamte Verarbeitung erfolgt lokal.

Verwendung

Server starten

python server.py

Claude Desktop Konfiguration

{
  "mcpServers": {
    "pdf-document": {
      "command": "python",
      "args": ["/path/to/pdf-document-mcp/server.py"]
    }
  }
}

Beispielaufrufe

Text aus einem PDF extrahieren:

Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf"}
Output: {"total_pages": 12, "total_characters": 48320, "pages": [{"page": 1, "text": "...", "char_count": 4210}, ...]}

Nur bestimmte Seiten extrahieren:

Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf", "pages": [1, 3, 5]}
Output: {"extracted_pages": 3, "pages": [...]}

PDF in Markdown konvertieren:

Tool: convert_pdf_to_markdown
Input: {"file_path": "/Users/me/documents/whitepaper.pdf"}
Output: {"markdown": "# whitepaper.pdf\n\n---\n## Page 1\n\n### Introduction\n\nThis paper presents...", "char_count": 15200}

Tabellen extrahieren:

Tool: extract_tables
Input: {"file_path": "/Users/me/documents/financials.pdf", "page_num": 3}
Output: {"tables_found": 2, "tables": [{"header": ["Quarter", "Revenue", "Profit"], "rows": [["Q1", "$1.2M", "$400K"], ...]}]}

Mehrere PDFs zusammenführen:

Tool: merge_pdfs
Input: {"file_paths": ["/tmp/part1.pdf", "/tmp/part2.pdf", "/tmp/part3.pdf"], "output_path": "/tmp/combined.pdf"}
Output: {"output": "/tmp/combined.pdf", "total_pages": 28}

Ein Dokument zusammenfassen:

Tool: summarize_document
Input: {"file_path": "/Users/me/documents/thesis.pdf"}
Output: {"statistics": {"total_pages": 45, "total_words": 12500, "total_images": 8}, "headings": [...], "metadata": {"author": "...", "title": "..."}}

Preise

Stufe

Limit

Preis

Kostenlos

20 Aufrufe/Tag

$0

Pro

Unbegrenzt + OCR-Unterstützung + Stapelverarbeitung

$9/Monat

Enterprise

Benutzerdefiniert + Prioritäts-Support

Kontaktieren Sie uns

Lizenz

MIT

-
security - not tested
F
license - not found
-
quality - not tested

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/CSOAI-ORG/pdf-document-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server