PDF Processor MCP Server

Integrations

  • Supports recognition and extraction of LaTeX mathematical equations from PDF documents

PDF-Prozessor MCP Server

Ein Model Context Protocol (MCP)-Server zur Verarbeitung von PDF-Dokumenten mit erweiterten Funktionen, einschließlich der Extraktion von LaTeX-Gleichungen. Dieser Server ermöglicht es Claude, Informationen aus PDF-Dokumenten abzurufen, zu verarbeiten und zu extrahieren, einschließlich mathematischer LaTeX-Gleichungen.

Merkmale

  • PDF-Abruf von URLs
  • Textextraktion aus PDFs
  • LaTeX-Gleichungserkennung und -extraktion
  • Integration mit Claude über MCP

Installation

Standardinstallation

pip install -e .

Installation für Claude Desktop/Claude Code

So verwenden Sie diesen MCP-Server mit Claude Desktop oder Claude Code:

  1. Installieren Sie die MCP CLI-Tools, falls sie noch nicht installiert sind:
    pip install "mcp[cli]"
  2. Installieren Sie den Server mit dem MCP-CLI-Tool:
    mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
    Wenn Sie dieses Repository beispielsweise nach ~/mcp_pdf_processor geklont haben:
    mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor
  3. Für die Entwicklung mit dem MCP Inspector:
    mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
  4. In Claude Desktop können Sie jetzt den PDF_TOOLS-Server mit diesen Befehlen in Ihren Konversationen verwenden:
    /mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

Verwendung

Standalone-Betrieb

python pdf_tool_server.py

Umgebungsvariablen

  • OUTPUT_DIR : Verzeichnis zum Speichern verarbeiteter PDFs (Standard: llm_output )
  • PYTHONPATH : Auf das Verzeichnis einstellen, das das Paket mcp_pdf_processor enthält

Verwendung mit Claude

Wenn der Server registriert ist, können Sie Claude bitten:

  • „PDF unter [URL] abrufen und analysieren“
  • „LaTeX-Gleichungen aus dem PDF unter [URL] extrahieren“
  • „Fassen Sie den Inhalt des PDFs unter [URL] zusammen.“

Anforderungen

Der Server erfordert die folgenden Hauptabhängigkeiten:

  • Python 3.9 oder höher
  • pymupdf : PDF-Verarbeitung und Textextraktion
  • mcp : Model Context Protocol-Unterstützung
  • pydantic : Datenvalidierung und -serialisierung
  • aiohttp : Asynchroner HTTP-Client/Server
  • torch : Zur Extraktion von LaTeX-Gleichungen (optional)
  • pix2tex : Zur LaTeX-Gleichungserkennung (optional)

Die vollständige Liste der Abhängigkeiten und Versionsanforderungen finden Sie in pyproject.toml .

Anwendungsbeispiele

Hier ist ein vollständiger Beispiel-Workflow für die Verwendung des PDF-Prozessors mit Claude Desktop:

# 1. Fetch a PDF without reading it /mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522 # This returns a hash_id, which you'll use in the next step # 2. Process the PDF with LaTeX extraction /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true # This returns a filename for the processed output # 3. Read the processed content /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME> # Now Claude can analyze the PDF content, including any LaTeX equations

Lizenz

MIT

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Ein Model Context Protocol-Server, der es Claude ermöglicht, Informationen aus PDF-Dokumenten abzurufen, zu verarbeiten und zu extrahieren, einschließlich mathematischer LaTeX-Gleichungen.

  1. Merkmale
    1. Installation
      1. Standardinstallation
      2. Installation für Claude Desktop/Claude Code
    2. Verwendung
      1. Standalone-Betrieb
      2. Umgebungsvariablen
      3. Verwendung mit Claude
    3. Anforderungen
      1. Anwendungsbeispiele
        1. Lizenz

          Related MCP Servers

          • -
            security
            A
            license
            -
            quality
            A Model Context Protocol server that allows Claude to create flashcards for Rember, helping users study and remember information through spaced repetition reviews.
            Last updated -
            88
            16
            TypeScript
            MIT License
          • -
            security
            A
            license
            -
            quality
            A Model Context Protocol server that integrates Claude with Blender, enabling users to analyze and interact with IFC (Industry Foundation Classes) building models through natural language commands.
            Last updated -
            5
            Python
            MIT License
            • Apple
          • -
            security
            F
            license
            -
            quality
            A Model Context Protocol server that allows Claude Desktop to perform document operations on Microsoft Word, Excel, and PDF files including creation, editing, and format conversion.
            Last updated -
            9
            Python
            • Apple
          • -
            security
            -
            license
            -
            quality
            A Model Context Protocol (MCP) server that converts LaTeX mathematical expressions to MathML format.
            Last updated -
            3
            JavaScript
            MIT License

          View all related MCP servers

          ID: nvzs48ghlz