PDF Processor MCP Server
PDF-Prozessor MCP Server
Ein Model Context Protocol (MCP)-Server zur Verarbeitung von PDF-Dokumenten mit erweiterten Funktionen, einschließlich der Extraktion von LaTeX-Gleichungen. Dieser Server ermöglicht es Claude, Informationen aus PDF-Dokumenten abzurufen, zu verarbeiten und zu extrahieren, einschließlich mathematischer LaTeX-Gleichungen.
Merkmale
PDF-Abruf von URLs
Textextraktion aus PDFs
LaTeX-Gleichungserkennung und -extraktion
Integration mit Claude über MCP
Related MCP server: MCP Web Research Server
Installation
Standardinstallation
pip install -e .Installation für Claude Desktop/Claude Code
So verwenden Sie diesen MCP-Server mit Claude Desktop oder Claude Code:
Installieren Sie die MCP CLI-Tools, falls sie noch nicht installiert sind:
pip install "mcp[cli]"Installieren Sie den Server mit dem MCP-CLI-Tool:
mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorWenn Sie dieses Repository beispielsweise nach
~/mcp_pdf_processorgeklont haben:mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processorFür die Entwicklung mit dem MCP Inspector:
mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorIn Claude Desktop können Sie jetzt den PDF_TOOLS-Server mit diesen Befehlen in Ihren Konversationen verwenden:
/mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>
Verwendung
Standalone-Betrieb
python pdf_tool_server.pyUmgebungsvariablen
OUTPUT_DIR: Verzeichnis zum Speichern verarbeiteter PDFs (Standard:llm_output)PYTHONPATH: Auf das Verzeichnis einstellen, das das Paket mcp_pdf_processor enthält
Verwendung mit Claude
Wenn der Server registriert ist, können Sie Claude bitten:
„PDF unter [URL] abrufen und analysieren“
„LaTeX-Gleichungen aus dem PDF unter [URL] extrahieren“
„Fassen Sie den Inhalt des PDFs unter [URL] zusammen.“
Anforderungen
Der Server erfordert die folgenden Hauptabhängigkeiten:
Python 3.9 oder höher
pymupdf: PDF-Verarbeitung und Textextraktionmcp: Model Context Protocol-Unterstützungpydantic: Datenvalidierung und -serialisierungaiohttp: Asynchroner HTTP-Client/Servertorch: Zur Extraktion von LaTeX-Gleichungen (optional)pix2tex: Zur LaTeX-Gleichungserkennung (optional)
Die vollständige Liste der Abhängigkeiten und Versionsanforderungen finden Sie in pyproject.toml .
Anwendungsbeispiele
Hier ist ein vollständiger Beispiel-Workflow für die Verwendung des PDF-Prozessors mit Claude Desktop:
# 1. Fetch a PDF without reading it
/mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522
# This returns a hash_id, which you'll use in the next step
# 2. Process the PDF with LaTeX extraction
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true
# This returns a filename for the processed output
# 3. Read the processed content
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>
# Now Claude can analyze the PDF content, including any LaTeX equationsLizenz
MIT
This server cannot be installed
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/MichaelLevinson/mcp_pdf_processor'
If you have feedback or need assistance with the MCP directory API, please join our Discord server