PDF-Prozessor MCP Server
Ein Model Context Protocol (MCP)-Server zur Verarbeitung von PDF-Dokumenten mit erweiterten Funktionen, einschließlich der Extraktion von LaTeX-Gleichungen. Dieser Server ermöglicht es Claude, Informationen aus PDF-Dokumenten abzurufen, zu verarbeiten und zu extrahieren, einschließlich mathematischer LaTeX-Gleichungen.
Merkmale
PDF-Abruf von URLs
Textextraktion aus PDFs
LaTeX-Gleichungserkennung und -extraktion
Integration mit Claude über MCP
Related MCP server: MCP Web Research Server
Installation
Standardinstallation
Installation für Claude Desktop/Claude Code
So verwenden Sie diesen MCP-Server mit Claude Desktop oder Claude Code:
Installieren Sie die MCP CLI-Tools, falls sie noch nicht installiert sind:
pip install "mcp[cli]"Installieren Sie den Server mit dem MCP-CLI-Tool:
mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorWenn Sie dieses Repository beispielsweise nach
~/mcp_pdf_processorgeklont haben:mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processorFür die Entwicklung mit dem MCP Inspector:
mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorIn Claude Desktop können Sie jetzt den PDF_TOOLS-Server mit diesen Befehlen in Ihren Konversationen verwenden:
/mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>
Verwendung
Standalone-Betrieb
Umgebungsvariablen
OUTPUT_DIR: Verzeichnis zum Speichern verarbeiteter PDFs (Standard:llm_output)PYTHONPATH: Auf das Verzeichnis einstellen, das das Paket mcp_pdf_processor enthält
Verwendung mit Claude
Wenn der Server registriert ist, können Sie Claude bitten:
„PDF unter [URL] abrufen und analysieren“
„LaTeX-Gleichungen aus dem PDF unter [URL] extrahieren“
„Fassen Sie den Inhalt des PDFs unter [URL] zusammen.“
Anforderungen
Der Server erfordert die folgenden Hauptabhängigkeiten:
Python 3.9 oder höher
pymupdf: PDF-Verarbeitung und Textextraktionmcp: Model Context Protocol-Unterstützungpydantic: Datenvalidierung und -serialisierungaiohttp: Asynchroner HTTP-Client/Servertorch: Zur Extraktion von LaTeX-Gleichungen (optional)pix2tex: Zur LaTeX-Gleichungserkennung (optional)
Die vollständige Liste der Abhängigkeiten und Versionsanforderungen finden Sie in pyproject.toml .
Anwendungsbeispiele
Hier ist ein vollständiger Beispiel-Workflow für die Verwendung des PDF-Prozessors mit Claude Desktop:
Lizenz
MIT