Skip to main content
Glama

MinerU Open MCP

Ein offizieller MinerU MCP-Server, der die Dokumentenanalyse von MinerU als MCP-Tools bereitstellt. Verbinden Sie einen beliebigen MCP-kompatiblen KI-Client, um PDFs, Word-Dokumente, PowerPoint-Dateien und Bilder in Markdown zu konvertieren.

Kein API-Schlüssel erforderlich — Der Flash-Modus funktioniert sofort, ist kostenlos und ohne Registrierung für Dateien bis zu 20 Seiten / 10 MB nutzbar. Setzen Sie MINERU_API_TOKEN, um höhere Limits und zusätzliche Ausgabeformate freizuschalten.


⚡ Schnellster Weg zur Ausführung — uvx (keine Installation erforderlich)

mineru-open-mcp ist auf PyPI verfügbar. Wenn uv installiert ist, können Sie es direkt ausführen — ohne separaten Installationsschritt.

Konfigurieren Sie Ihren MCP-Client

stdio — Claude Desktop, Cursor, Windsurf

Der MCP-Client startet mineru-open-mcp automatisch als Unterprozess.

Verwendung von uvx (empfohlen — führt immer die neueste Version aus):

{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "your_key_here"
      }
    }
  }
}

Kein API-Schlüssel? Der Server läuft im Flash-Modus — kostenlos, nur Markdown, erfahren Sie mehr unter Flash Mode Docs

mineru-open-mcp nicht im PATH? Verwenden Sie den vollständigen Pfad: "/Users/you/.local/bin/mineru-open-mcp" oder verwenden Sie den oben genannten uvx-Ansatz, der dies automatisch handhabt.

Anwendungsbeispiele

Beispiel 1: Parsen eines lokalen PDF-Dokuments mit Zielseitenbereichen

Benutzeraufforderung: "Parse die 3.-5. Seite dieses PDFs in Markdown: <your_path_to_file>" Was passiert:

  • MinerU lädt das PDF hoch und parst es

  • Gibt sauberes Markdown mit Tabellen (HTML) und Formeln (Latex) zurück

  • Gibt Markdown-Texte im Chat zurück, sofern die Länge dies zulässt, zusammen mit dem Ausgabepfad und der Zip-URL, falls bevorzugt

  • Der MCP-Client fasst den Inhalt zusammen

Beispiel 2: Parsen einer Remote-URL, die eine Datei hostet

Benutzeraufforderung: "Extrahiere Inhalte aus diesem Paper: https://arxiv.org/pdf/2509.22186" Was passiert:

  • MinerU parst das Paper in Markdown

  • Der MCP-Client formatiert und erklärt die Tabellen

Beispiel 3: Parsen lokaler PDF-Dateien mit unabhängigen Seitenbereichen

Benutzeraufforderung: "Parse Seite 1-5, Seite 2-9, Seite 3 in Markdown" Was passiert:

  • MinerU lädt die Dateien hoch und parst sie separat

  • Gibt Ausgaben im Zielformat, die Zip-URL zum Herunterladen, eine Markdown-Zusammenfassung und das Verzeichnis zurück, in dem Sie die Ausgabe speichern möchten

  • Der MCP-Client verwendet den Inhalt für weitere Analysen

Beispiel 4: Erweiterte benutzerdefinierte Einstellungen

Benutzeraufforderung1: "Verwende das Pipeline-Modell, um diese koreanische Datei zu parsen your_path_here" Benutzeraufforderung2: "Parse your_path_here und speichere das Markdown in your_output_dir" Was passiert:

  • Das Pipeline-Modell ist ein weiteres Modell, das vom MinerU-Dienst bereitgestellt wird (übrigens ist das VLM-Modell die Standardwahl)

  • Sie können ein Modell, eine OCR-Sprache oder sogar ein unabhängiges Ausgabeverzeichnis angeben, das sich von OUTPUT_DIR unterscheidet, indem Sie Ihre Aufforderung strukturieren

  • Ihre Anfragen werden in das Tool parse_documents parametrisiert und MinerU erledigt den Rest.

streamable-http — webbasierte MCP-Clients

Starten Sie den Server manuell und verweisen Sie dann Ihren Client darauf:

MINERU_API_TOKEN=your_key mineru-open-mcp --transport streamable-http --port 8001
{
  "mcpServers": {
    "mineru": {
      "type": "streamableHttp",
      "url": "http://127.0.0.1:8001/mcp"
    }
  }
}

Funktionen

  • parse_documents — konvertiert lokale Dateien und/oder Remote-URLs in Markdown; Eingabe unterstützt PDF, Bilder (png/jpg/jpeg/jp2/webp/gif/bmp), Doc, Docx, Ppt, PPTx. Der Flash-Modus unterstützt auch xlsx.

  • get_ocr_languages — listet alle von MinerU unterstützten OCR-Sprachen auf

  • Flash-Modus — funktioniert ohne API-Schlüssel (kostenlos, nur Markdown-Ausgabe, unterstützt PDF/Bilder/Docx/PPTx/xls/xlsx); Für den vollen Funktionsumfang geben Sie bitte MINERU_API_TOKEN an, wodurch der Flash-Modus deaktiviert wird.

  • Ausgabeverhalten — Einzeldateiparsings geben standardmäßig Inline-Markdown zurück; Batch-Parsings speichern Ergebnisse auf der Festplatte und geben Dateimetadaten zurück. Zu große Inline-Inhalte werden ebenfalls lokal gespeichert und über extract_path zurückgegeben.

  • Zwei Transportmodistdio, streamable-http


Umgebungsvariablen

Variable

Beschreibung

Standardwert

MINERU_API_TOKEN

MinerU API-Token, beantragen Sie es auf MinerU für den vollen Funktionsumfang. Wenn nicht angegeben, ist der Flash-Modus aktiviert.

OUTPUT_DIR

Verzeichnis, das verwendet wird, wenn geparste Ergebnisse lokal gespeichert werden müssen, z. B. bei Batch-Parsings oder zu großen Inline-Inhalten

~/mineru-downloads

Datenschutzrichtlinie

mineru-open-mcp verbindet sich mit der offiziellen MinerU-API (mineru.net), um Dokumente zu parsen.

  • Gesendete Daten: Dokumentinhalt (Dateien oder URLs, die Sie zum Parsen bereitstellen)

  • Datenspeicherung: Geparste Ergebnisse werden vorübergehend von MinerU-Servern zwischengespeichert; sie werden nicht für das Training verwendet

  • Drittanbieter: MinerU API (mineru.net) — siehe MinerU Datenschutzrichtlinie

  • Lokale Daten: Geparste Ergebnisse werden im Ziel-Ausgabeverzeichnis gespeichert. Protokolldateien (nur wenn ENABLE_LOG=true) werden in MINERU_LOG_DIR gespeichert;

  • Kontakt: OpenDataLab@pjlab.org.cn (oder erstellen Sie ein Issue unter MinerU-Ecosystem )

Install Server
A
security – no known vulnerabilities
A
license - permissive license
C
quality - C tier

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/opendatalab/MinerU-Ecosystem'

If you have feedback or need assistance with the MCP directory API, please join our Discord server