PDF Document MCP Server
PDF-Dokument-MCP-Server
Von MEOK AI Labs | meok.ai
Dokumentenverarbeitungs-Toolkit für KI-Agenten. Extrahieren Sie Text, konvertieren Sie in Markdown, führen Sie PDFs zusammen, extrahieren Sie Tabellen und fassen Sie Dokumente zusammen – alles lokal ohne externe API-Abhängigkeiten.
Tools
Tool | Beschreibung |
| Extrahiert Text aus allen oder bestimmten Seiten eines PDFs |
| Konvertiert PDF in strukturiertes Markdown mit Überschriftenerkennung |
| Führt mehrere PDF-Dateien zu einem einzigen Dokument zusammen |
| Extrahiert Tabellenstrukturen von einer PDF-Seite mittels Positionsanalyse |
| Generiert Metadaten, Statistiken, Überschriften und Zusammenfassungen pro Seite |
Installation
pip install mcp PyMuPDFKeine externen Dienste, API-Schlüssel oder Cloud-Abhängigkeiten erforderlich. Die gesamte Verarbeitung erfolgt lokal.
Verwendung
Server starten
python server.pyClaude Desktop Konfiguration
{
"mcpServers": {
"pdf-document": {
"command": "python",
"args": ["/path/to/pdf-document-mcp/server.py"]
}
}
}Beispielaufrufe
Text aus einem PDF extrahieren:
Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf"}
Output: {"total_pages": 12, "total_characters": 48320, "pages": [{"page": 1, "text": "...", "char_count": 4210}, ...]}Nur bestimmte Seiten extrahieren:
Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf", "pages": [1, 3, 5]}
Output: {"extracted_pages": 3, "pages": [...]}PDF in Markdown konvertieren:
Tool: convert_pdf_to_markdown
Input: {"file_path": "/Users/me/documents/whitepaper.pdf"}
Output: {"markdown": "# whitepaper.pdf\n\n---\n## Page 1\n\n### Introduction\n\nThis paper presents...", "char_count": 15200}Tabellen extrahieren:
Tool: extract_tables
Input: {"file_path": "/Users/me/documents/financials.pdf", "page_num": 3}
Output: {"tables_found": 2, "tables": [{"header": ["Quarter", "Revenue", "Profit"], "rows": [["Q1", "$1.2M", "$400K"], ...]}]}Mehrere PDFs zusammenführen:
Tool: merge_pdfs
Input: {"file_paths": ["/tmp/part1.pdf", "/tmp/part2.pdf", "/tmp/part3.pdf"], "output_path": "/tmp/combined.pdf"}
Output: {"output": "/tmp/combined.pdf", "total_pages": 28}Ein Dokument zusammenfassen:
Tool: summarize_document
Input: {"file_path": "/Users/me/documents/thesis.pdf"}
Output: {"statistics": {"total_pages": 45, "total_words": 12500, "total_images": 8}, "headings": [...], "metadata": {"author": "...", "title": "..."}}Preise
Stufe | Limit | Preis |
Kostenlos | 20 Aufrufe/Tag | $0 |
Pro | Unbegrenzt + OCR-Unterstützung + Stapelverarbeitung | $9/Monat |
Enterprise | Benutzerdefiniert + Prioritäts-Support | Kontaktieren Sie uns |
Lizenz
MIT
This server cannot be installed
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/CSOAI-ORG/pdf-document-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server