PDF-Prozessor MCP Server

Ein Model Context Protocol (MCP)-Server zur Verarbeitung von PDF-Dokumenten mit erweiterten Funktionen, einschließlich der Extraktion von LaTeX-Gleichungen. Dieser Server ermöglicht es Claude, Informationen aus PDF-Dokumenten abzurufen, zu verarbeiten und zu extrahieren, einschließlich mathematischer LaTeX-Gleichungen.

Merkmale

PDF-Abruf von URLs
Textextraktion aus PDFs
LaTeX-Gleichungserkennung und -extraktion
Integration mit Claude über MCP

Related MCP server: MCP Web Research Server

Installation

Standardinstallation

pip install -e .

Installation für Claude Desktop/Claude Code

So verwenden Sie diesen MCP-Server mit Claude Desktop oder Claude Code:

Installieren Sie die MCP CLI-Tools, falls sie noch nicht installiert sind:
```
pip install "mcp[cli]"
```

Installieren Sie den Server mit dem MCP-CLI-Tool:

mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor

Wenn Sie dieses Repository beispielsweise nach ~/mcp_pdf_processor geklont haben:

mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor

Für die Entwicklung mit dem MCP Inspector:

mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor

In Claude Desktop können Sie jetzt den PDF_TOOLS-Server mit diesen Befehlen in Ihren Konversationen verwenden:

/mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

Verwendung

Standalone-Betrieb

python pdf_tool_server.py

Umgebungsvariablen

OUTPUT_DIR : Verzeichnis zum Speichern verarbeiteter PDFs (Standard: llm_output )
PYTHONPATH : Auf das Verzeichnis einstellen, das das Paket mcp_pdf_processor enthält

Verwendung mit Claude

Wenn der Server registriert ist, können Sie Claude bitten:

„PDF unter [URL] abrufen und analysieren“
„LaTeX-Gleichungen aus dem PDF unter [URL] extrahieren“
„Fassen Sie den Inhalt des PDFs unter [URL] zusammen.“

Anforderungen

Der Server erfordert die folgenden Hauptabhängigkeiten:

Python 3.9 oder höher
pymupdf : PDF-Verarbeitung und Textextraktion
mcp : Model Context Protocol-Unterstützung
pydantic : Datenvalidierung und -serialisierung
aiohttp : Asynchroner HTTP-Client/Server
torch : Zur Extraktion von LaTeX-Gleichungen (optional)
pix2tex : Zur LaTeX-Gleichungserkennung (optional)

Die vollständige Liste der Abhängigkeiten und Versionsanforderungen finden Sie in pyproject.toml .

Anwendungsbeispiele

Hier ist ein vollständiger Beispiel-Workflow für die Verwendung des PDF-Prozessors mit Claude Desktop:

# 1. Fetch a PDF without reading it
/mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522

# This returns a hash_id, which you'll use in the next step

# 2. Process the PDF with LaTeX extraction
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true

# This returns a filename for the processed output

# 3. Read the processed content
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

# Now Claude can analyze the PDF content, including any LaTeX equations

Lizenz

MIT

This server cannot be installed

A

license - permissive license

-

quality - not tested

C

maintenance

How are these scores calculated?

Resources

GitHub Repository

Need Help?

Related Servers

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

PDF Processor MCP Server