Skip to main content
Glama

MinerU Open MCP

Un servidor oficial de MinerU MCP que expone el análisis de documentos de MinerU como herramientas MCP. Conecta cualquier cliente de IA compatible con MCP para convertir archivos PDF, documentos de Word, archivos de PowerPoint e imágenes a Markdown.

No se requiere clave API: el modo Flash funciona de inmediato, es gratuito y sin registro, para archivos de hasta 20 páginas / 10 MB. Configura MINERU_API_TOKEN para desbloquear límites más altos y formatos de salida adicionales.


⚡ La forma más rápida de ejecutarlo: uvx (no requiere instalación)

mineru-open-mcp está en PyPI. Con uv instalado, puedes ejecutarlo directamente, sin pasos de instalación adicionales.

Configura tu cliente MCP

stdio: Claude Desktop, Cursor, Windsurf

El cliente MCP inicia mineru-open-mcp como un subproceso automáticamente.

Usando uvx (recomendado: siempre ejecuta la última versión):

{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "your_key_here"
      }
    }
  }
}

¿No tienes clave API? El servidor se ejecuta en modo Flash: gratuito, solo markdown, obtén más información en la Documentación del modo Flash

¿mineru-open-mcp no está en el PATH? Usa la ruta completa: "/Users/you/.local/bin/mineru-open-mcp", o usa el enfoque uvx anterior que maneja esto automáticamente.

Ejemplos de uso

Ejemplo 1: Analizar un documento PDF local con rangos de páginas específicos

Prompt del usuario: "Analiza de la 3ª a la 5ª página de este PDF a markdown: <tu_ruta_al_archivo>" Qué sucede:

  • MinerU sube y analiza el PDF

  • Devuelve Markdown limpio con tablas (HTML) y fórmulas (Latex) preservadas

  • Devuelve textos en markdown en el chat si la longitud lo permite junto con la ruta de salida, y la URL del zip si lo prefieres

  • El cliente MCP resume el contenido

Ejemplo 2: Analizar una URL remota que aloja un archivo

Prompt del usuario: "Extrae el contenido de este artículo: https://arxiv.org/pdf/2509.22186" Qué sucede:

  • MinerU analiza el artículo a markdown

  • El cliente MCP formatea y explica las tablas

Ejemplo 3: Analizar archivos PDF locales con rangos de páginas independientes

Prompt del usuario: "Analiza páginas 1-5, páginas 2-9, página 3 a markdown" Qué sucede:

  • MinerU sube y analiza los archivos por separado

  • Devuelve las salidas en el formato objetivo, la URL del zip para que la descargues, el resumen en markdown y el directorio donde quieres guardar la salida

  • El cliente MCP utiliza el contenido para un análisis posterior

Ejemplo 4: Preferencias personalizadas avanzadas

Prompt del usuario 1: "usa el modelo pipeline para analizar este archivo coreano tu_ruta_aquí" Prompt del usuario 2: "analiza tu_ruta_aquí y guarda el markdown en tu_directorio_de_salida" Qué sucede:

  • El modelo Pipeline es otro modelo proporcionado por el servicio MinerU (por cierto, el modelo vlm es la opción predeterminada)

  • Puedes especificar un modelo, un idioma de OCR o incluso un directorio de salida independiente diferente de OUTPUT_DIR estructurando tu prompt

  • Tus solicitudes se parametrizan en la herramienta parse_documents y MinerU se encargará del resto.

streamable-http: clientes MCP basados en web

Inicia el servidor manualmente y luego apunta tu cliente hacia él:

MINERU_API_TOKEN=your_key mineru-open-mcp --transport streamable-http --port 8001
{
  "mcpServers": {
    "mineru": {
      "type": "streamableHttp",
      "url": "http://127.0.0.1:8001/mcp"
    }
  }
}

Características

  • parse_documents: convierte archivos locales y/o URLs remotas a Markdown; la entrada admite PDF, imágenes (png/jpg/jpeg/jp2/webp/gif/bmp), Doc, Docx, Ppt, PPTx. El modo Flash también admite xlsx.

  • get_ocr_languages: enumera todos los idiomas de OCR admitidos por MinerU

  • Modo Flash: funciona sin clave API (gratuito, solo salida markdown, admite PDF/imágenes/Docx/PPTx/xls/xlsx); para obtener todas las funciones, proporciona MINERU_API_TOKEN, lo que desactivará el modo flash.

  • Comportamiento de salida: los análisis de un solo archivo devuelven Markdown en línea de forma predeterminada; los análisis por lotes guardan los resultados en el disco y devuelven metadatos del archivo. El contenido en línea de gran tamaño también se guarda localmente y se devuelve a través de extract_path.

  • Dos modos de transporte: stdio, streamable-http


Variables de entorno

Variable

Descripción

Predeterminado

MINERU_API_TOKEN

Token de la API de MinerU, solicítalo en MinerU para obtener la capacidad completa. Si no se proporciona, se habilita el modo flash.

OUTPUT_DIR

Directorio utilizado cuando los resultados analizados deben guardarse localmente, como en el análisis por lotes o contenido en línea de gran tamaño

~/mineru-downloads

Política de privacidad

mineru-open-mcp se conecta a la API oficial de MinerU (mineru.net) para analizar documentos.

  • Datos enviados: Contenido del documento (archivos o URLs que proporcionas para el análisis)

  • Almacenamiento de datos: Los resultados analizados son almacenados temporalmente en caché por los servidores de MinerU; no se utilizan para entrenamiento

  • Terceros: API de MinerU (mineru.net): consulta la Política de privacidad de MinerU

  • Datos locales: Los resultados analizados se guardarán en el directorio de salida de destino. Los archivos de registro (solo cuando ENABLE_LOG=true) se guardan en MINERU_LOG_DIR;

  • Contacto: OpenDataLab@pjlab.org.cn (o abre un issue en MinerU-Ecosystem )

Install Server
A
security – no known vulnerabilities
A
license - permissive license
C
quality - C tier

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/opendatalab/MinerU-Ecosystem'

If you have feedback or need assistance with the MCP directory API, please join our Discord server