PDF-Prozessor MCP Server
Ein Model Context Protocol (MCP)-Server zur Verarbeitung von PDF-Dokumenten mit erweiterten Funktionen, einschließlich der Extraktion von LaTeX-Gleichungen. Dieser Server ermöglicht es Claude, Informationen aus PDF-Dokumenten abzurufen, zu verarbeiten und zu extrahieren, einschließlich mathematischer LaTeX-Gleichungen.
Merkmale
PDF-Abruf von URLs
Textextraktion aus PDFs
LaTeX-Gleichungserkennung und -extraktion
Integration mit Claude über MCP
Installation
Standardinstallation
Installation für Claude Desktop/Claude Code
So verwenden Sie diesen MCP-Server mit Claude Desktop oder Claude Code:
Installieren Sie die MCP CLI-Tools, falls sie noch nicht installiert sind:
pip install "mcp[cli]"Installieren Sie den Server mit dem MCP-CLI-Tool:
mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorWenn Sie dieses Repository beispielsweise nach
~/mcp_pdf_processor
geklont haben:mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processorFür die Entwicklung mit dem MCP Inspector:
mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorIn Claude Desktop können Sie jetzt den PDF_TOOLS-Server mit diesen Befehlen in Ihren Konversationen verwenden:
/mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>
Verwendung
Standalone-Betrieb
Umgebungsvariablen
OUTPUT_DIR
: Verzeichnis zum Speichern verarbeiteter PDFs (Standard:llm_output
)PYTHONPATH
: Auf das Verzeichnis einstellen, das das Paket mcp_pdf_processor enthält
Verwendung mit Claude
Wenn der Server registriert ist, können Sie Claude bitten:
„PDF unter [URL] abrufen und analysieren“
„LaTeX-Gleichungen aus dem PDF unter [URL] extrahieren“
„Fassen Sie den Inhalt des PDFs unter [URL] zusammen.“
Anforderungen
Der Server erfordert die folgenden Hauptabhängigkeiten:
Python 3.9 oder höher
pymupdf
: PDF-Verarbeitung und Textextraktionmcp
: Model Context Protocol-Unterstützungpydantic
: Datenvalidierung und -serialisierungaiohttp
: Asynchroner HTTP-Client/Servertorch
: Zur Extraktion von LaTeX-Gleichungen (optional)pix2tex
: Zur LaTeX-Gleichungserkennung (optional)
Die vollständige Liste der Abhängigkeiten und Versionsanforderungen finden Sie in pyproject.toml
.
Anwendungsbeispiele
Hier ist ein vollständiger Beispiel-Workflow für die Verwendung des PDF-Prozessors mit Claude Desktop:
Lizenz
MIT
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Ein Model Context Protocol-Server, der es Claude ermöglicht, Informationen aus PDF-Dokumenten abzurufen, zu verarbeiten und zu extrahieren, einschließlich mathematischer LaTeX-Gleichungen.
Related MCP Servers
- AsecurityAlicenseAqualityModel Context Protocol server that enables Claude Desktop (or any MCP client) to fetch web content and process images appropriately.Last updated -1106MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables Claude to perform web research by integrating Google search, extracting webpage content, and capturing screenshots.Last updated -315,70416MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables Claude to perform advanced web research with intelligent search queuing, enhanced content extraction, and deep research capabilities.Last updated -391MIT License
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server that enables Claude or other LLMs to fetch content from URLs, supporting HTML, JSON, text, and images with configurable request parameters.Last updated -32MIT License