Skip to main content
Glama

PDF-Prozessor MCP Server

Ein Model Context Protocol (MCP)-Server zur Verarbeitung von PDF-Dokumenten mit erweiterten Funktionen, einschließlich der Extraktion von LaTeX-Gleichungen. Dieser Server ermöglicht es Claude, Informationen aus PDF-Dokumenten abzurufen, zu verarbeiten und zu extrahieren, einschließlich mathematischer LaTeX-Gleichungen.

Merkmale

  • PDF-Abruf von URLs

  • Textextraktion aus PDFs

  • LaTeX-Gleichungserkennung und -extraktion

  • Integration mit Claude über MCP

Related MCP server: MCP Web Research Server

Installation

Standardinstallation

pip install -e .

Installation für Claude Desktop/Claude Code

So verwenden Sie diesen MCP-Server mit Claude Desktop oder Claude Code:

  1. Installieren Sie die MCP CLI-Tools, falls sie noch nicht installiert sind:

    pip install "mcp[cli]"
  2. Installieren Sie den Server mit dem MCP-CLI-Tool:

    mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor

    Wenn Sie dieses Repository beispielsweise nach ~/mcp_pdf_processor geklont haben:

    mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor
  3. Für die Entwicklung mit dem MCP Inspector:

    mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
  4. In Claude Desktop können Sie jetzt den PDF_TOOLS-Server mit diesen Befehlen in Ihren Konversationen verwenden:

    /mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf
    /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true
    /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

Verwendung

Standalone-Betrieb

python pdf_tool_server.py

Umgebungsvariablen

  • OUTPUT_DIR : Verzeichnis zum Speichern verarbeiteter PDFs (Standard: llm_output )

  • PYTHONPATH : Auf das Verzeichnis einstellen, das das Paket mcp_pdf_processor enthält

Verwendung mit Claude

Wenn der Server registriert ist, können Sie Claude bitten:

  • „PDF unter [URL] abrufen und analysieren“

  • „LaTeX-Gleichungen aus dem PDF unter [URL] extrahieren“

  • „Fassen Sie den Inhalt des PDFs unter [URL] zusammen.“

Anforderungen

Der Server erfordert die folgenden Hauptabhängigkeiten:

  • Python 3.9 oder höher

  • pymupdf : PDF-Verarbeitung und Textextraktion

  • mcp : Model Context Protocol-Unterstützung

  • pydantic : Datenvalidierung und -serialisierung

  • aiohttp : Asynchroner HTTP-Client/Server

  • torch : Zur Extraktion von LaTeX-Gleichungen (optional)

  • pix2tex : Zur LaTeX-Gleichungserkennung (optional)

Die vollständige Liste der Abhängigkeiten und Versionsanforderungen finden Sie in pyproject.toml .

Anwendungsbeispiele

Hier ist ein vollständiger Beispiel-Workflow für die Verwendung des PDF-Prozessors mit Claude Desktop:

# 1. Fetch a PDF without reading it
/mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522

# This returns a hash_id, which you'll use in the next step

# 2. Process the PDF with LaTeX extraction
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true

# This returns a filename for the processed output

# 3. Read the processed content
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

# Now Claude can analyze the PDF content, including any LaTeX equations

Lizenz

MIT

A
license - permissive license
-
quality - not tested
C
maintenance

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/MichaelLevinson/mcp_pdf_processor'

If you have feedback or need assistance with the MCP directory API, please join our Discord server