MinerU Open MCP (Official)
MinerU Open MCP
Ein offizieller MinerU MCP-Server, der die Dokumentenanalyse von MinerU als MCP-Tools bereitstellt. Verbinden Sie einen beliebigen MCP-kompatiblen KI-Client, um PDFs, Word-Dokumente, PowerPoint-Dateien und Bilder in Markdown zu konvertieren.
Kein API-Schlüssel erforderlich — Der Flash-Modus funktioniert sofort, ist kostenlos und ohne Registrierung für Dateien bis zu 20 Seiten / 10 MB nutzbar. Setzen Sie MINERU_API_TOKEN, um höhere Limits und zusätzliche Ausgabeformate freizuschalten.
⚡ Schnellster Weg zur Ausführung — uvx (keine Installation erforderlich)
mineru-open-mcp ist auf PyPI verfügbar. Wenn uv installiert ist, können Sie es direkt ausführen — ohne separaten Installationsschritt.
Konfigurieren Sie Ihren MCP-Client
stdio — Claude Desktop, Cursor, Windsurf
Der MCP-Client startet mineru-open-mcp automatisch als Unterprozess.
Verwendung von uvx (empfohlen — führt immer die neueste Version aus):
{
"mcpServers": {
"mineru": {
"command": "uvx",
"args": ["mineru-open-mcp"],
"env": {
"MINERU_API_TOKEN": "your_key_here"
}
}
}
}Kein API-Schlüssel? Der Server läuft im Flash-Modus — kostenlos, nur Markdown, erfahren Sie mehr unter Flash Mode Docs
mineru-open-mcpnicht im PATH? Verwenden Sie den vollständigen Pfad:"/Users/you/.local/bin/mineru-open-mcp"oder verwenden Sie den oben genanntenuvx-Ansatz, der dies automatisch handhabt.
Anwendungsbeispiele
Beispiel 1: Parsen eines lokalen PDF-Dokuments mit Zielseitenbereichen
Benutzeraufforderung: "Parse die 3.-5. Seite dieses PDFs in Markdown: <your_path_to_file>" Was passiert:
MinerU lädt das PDF hoch und parst es
Gibt sauberes Markdown mit Tabellen (HTML) und Formeln (Latex) zurück
Gibt Markdown-Texte im Chat zurück, sofern die Länge dies zulässt, zusammen mit dem Ausgabepfad und der Zip-URL, falls bevorzugt
Der MCP-Client fasst den Inhalt zusammen
Beispiel 2: Parsen einer Remote-URL, die eine Datei hostet
Benutzeraufforderung: "Extrahiere Inhalte aus diesem Paper: https://arxiv.org/pdf/2509.22186" Was passiert:
MinerU parst das Paper in Markdown
Der MCP-Client formatiert und erklärt die Tabellen
Beispiel 3: Parsen lokaler PDF-Dateien mit unabhängigen Seitenbereichen
Benutzeraufforderung: "Parse Seite 1-5, Seite 2-9, Seite 3 in Markdown" Was passiert:
MinerU lädt die Dateien hoch und parst sie separat
Gibt Ausgaben im Zielformat, die Zip-URL zum Herunterladen, eine Markdown-Zusammenfassung und das Verzeichnis zurück, in dem Sie die Ausgabe speichern möchten
Der MCP-Client verwendet den Inhalt für weitere Analysen
Beispiel 4: Erweiterte benutzerdefinierte Einstellungen
Benutzeraufforderung1: "Verwende das Pipeline-Modell, um diese koreanische Datei zu parsen your_path_here" Benutzeraufforderung2: "Parse your_path_here und speichere das Markdown in your_output_dir" Was passiert:
Das Pipeline-Modell ist ein weiteres Modell, das vom MinerU-Dienst bereitgestellt wird (übrigens ist das VLM-Modell die Standardwahl)
Sie können ein Modell, eine OCR-Sprache oder sogar ein unabhängiges Ausgabeverzeichnis angeben, das sich von OUTPUT_DIR unterscheidet, indem Sie Ihre Aufforderung strukturieren
Ihre Anfragen werden in das Tool
parse_documentsparametrisiert und MinerU erledigt den Rest.
streamable-http — webbasierte MCP-Clients
Starten Sie den Server manuell und verweisen Sie dann Ihren Client darauf:
MINERU_API_TOKEN=your_key mineru-open-mcp --transport streamable-http --port 8001{
"mcpServers": {
"mineru": {
"type": "streamableHttp",
"url": "http://127.0.0.1:8001/mcp"
}
}
}Funktionen
parse_documents— konvertiert lokale Dateien und/oder Remote-URLs in Markdown; Eingabe unterstützt PDF, Bilder (png/jpg/jpeg/jp2/webp/gif/bmp), Doc, Docx, Ppt, PPTx. Der Flash-Modus unterstützt auch xlsx.get_ocr_languages— listet alle von MinerU unterstützten OCR-Sprachen aufFlash-Modus — funktioniert ohne API-Schlüssel (kostenlos, nur Markdown-Ausgabe, unterstützt PDF/Bilder/Docx/PPTx/xls/xlsx); Für den vollen Funktionsumfang geben Sie bitte
MINERU_API_TOKENan, wodurch der Flash-Modus deaktiviert wird.Ausgabeverhalten — Einzeldateiparsings geben standardmäßig Inline-Markdown zurück; Batch-Parsings speichern Ergebnisse auf der Festplatte und geben Dateimetadaten zurück. Zu große Inline-Inhalte werden ebenfalls lokal gespeichert und über
extract_pathzurückgegeben.Zwei Transportmodi —
stdio,streamable-http
Umgebungsvariablen
Variable | Beschreibung | Standardwert |
| MinerU API-Token, beantragen Sie es auf MinerU für den vollen Funktionsumfang. Wenn nicht angegeben, ist der Flash-Modus aktiviert. | — |
| Verzeichnis, das verwendet wird, wenn geparste Ergebnisse lokal gespeichert werden müssen, z. B. bei Batch-Parsings oder zu großen Inline-Inhalten |
|
Datenschutzrichtlinie
mineru-open-mcp verbindet sich mit der offiziellen MinerU-API (mineru.net), um Dokumente zu parsen.
Gesendete Daten: Dokumentinhalt (Dateien oder URLs, die Sie zum Parsen bereitstellen)
Datenspeicherung: Geparste Ergebnisse werden vorübergehend von MinerU-Servern zwischengespeichert; sie werden nicht für das Training verwendet
Drittanbieter: MinerU API (mineru.net) — siehe MinerU Datenschutzrichtlinie
Lokale Daten: Geparste Ergebnisse werden im Ziel-Ausgabeverzeichnis gespeichert. Protokolldateien (nur wenn ENABLE_LOG=true) werden in MINERU_LOG_DIR gespeichert;
Kontakt: OpenDataLab@pjlab.org.cn (oder erstellen Sie ein Issue unter MinerU-Ecosystem )
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/opendatalab/MinerU-Ecosystem'
If you have feedback or need assistance with the MCP directory API, please join our Discord server