MinerU Open MCP (Official)
MinerU Open MCP
Un servidor oficial de MinerU MCP que expone el análisis de documentos de MinerU como herramientas MCP. Conecta cualquier cliente de IA compatible con MCP para convertir archivos PDF, documentos de Word, archivos de PowerPoint e imágenes a Markdown.
No se requiere clave API: el modo Flash funciona de inmediato, es gratuito y sin registro, para archivos de hasta 20 páginas / 10 MB. Configura MINERU_API_TOKEN para desbloquear límites más altos y formatos de salida adicionales.
⚡ La forma más rápida de ejecutarlo: uvx (no requiere instalación)
mineru-open-mcp está en PyPI. Con uv instalado, puedes ejecutarlo directamente, sin pasos de instalación adicionales.
Configura tu cliente MCP
stdio: Claude Desktop, Cursor, Windsurf
El cliente MCP inicia mineru-open-mcp como un subproceso automáticamente.
Usando uvx (recomendado: siempre ejecuta la última versión):
{
"mcpServers": {
"mineru": {
"command": "uvx",
"args": ["mineru-open-mcp"],
"env": {
"MINERU_API_TOKEN": "your_key_here"
}
}
}
}¿No tienes clave API? El servidor se ejecuta en modo Flash: gratuito, solo markdown, obtén más información en la Documentación del modo Flash
¿
mineru-open-mcpno está en el PATH? Usa la ruta completa:"/Users/you/.local/bin/mineru-open-mcp", o usa el enfoqueuvxanterior que maneja esto automáticamente.
Ejemplos de uso
Ejemplo 1: Analizar un documento PDF local con rangos de páginas específicos
Prompt del usuario: "Analiza de la 3ª a la 5ª página de este PDF a markdown: <tu_ruta_al_archivo>" Qué sucede:
MinerU sube y analiza el PDF
Devuelve Markdown limpio con tablas (HTML) y fórmulas (Latex) preservadas
Devuelve textos en markdown en el chat si la longitud lo permite junto con la ruta de salida, y la URL del zip si lo prefieres
El cliente MCP resume el contenido
Ejemplo 2: Analizar una URL remota que aloja un archivo
Prompt del usuario: "Extrae el contenido de este artículo: https://arxiv.org/pdf/2509.22186" Qué sucede:
MinerU analiza el artículo a markdown
El cliente MCP formatea y explica las tablas
Ejemplo 3: Analizar archivos PDF locales con rangos de páginas independientes
Prompt del usuario: "Analiza páginas 1-5, páginas 2-9, página 3 a markdown" Qué sucede:
MinerU sube y analiza los archivos por separado
Devuelve las salidas en el formato objetivo, la URL del zip para que la descargues, el resumen en markdown y el directorio donde quieres guardar la salida
El cliente MCP utiliza el contenido para un análisis posterior
Ejemplo 4: Preferencias personalizadas avanzadas
Prompt del usuario 1: "usa el modelo pipeline para analizar este archivo coreano tu_ruta_aquí" Prompt del usuario 2: "analiza tu_ruta_aquí y guarda el markdown en tu_directorio_de_salida" Qué sucede:
El modelo Pipeline es otro modelo proporcionado por el servicio MinerU (por cierto, el modelo vlm es la opción predeterminada)
Puedes especificar un modelo, un idioma de OCR o incluso un directorio de salida independiente diferente de OUTPUT_DIR estructurando tu prompt
Tus solicitudes se parametrizan en la herramienta parse_documents y MinerU se encargará del resto.
streamable-http: clientes MCP basados en web
Inicia el servidor manualmente y luego apunta tu cliente hacia él:
MINERU_API_TOKEN=your_key mineru-open-mcp --transport streamable-http --port 8001{
"mcpServers": {
"mineru": {
"type": "streamableHttp",
"url": "http://127.0.0.1:8001/mcp"
}
}
}Características
parse_documents: convierte archivos locales y/o URLs remotas a Markdown; la entrada admite PDF, imágenes (png/jpg/jpeg/jp2/webp/gif/bmp), Doc, Docx, Ppt, PPTx. El modo Flash también admite xlsx.get_ocr_languages: enumera todos los idiomas de OCR admitidos por MinerUModo Flash: funciona sin clave API (gratuito, solo salida markdown, admite PDF/imágenes/Docx/PPTx/xls/xlsx); para obtener todas las funciones, proporciona
MINERU_API_TOKEN, lo que desactivará el modo flash.Comportamiento de salida: los análisis de un solo archivo devuelven Markdown en línea de forma predeterminada; los análisis por lotes guardan los resultados en el disco y devuelven metadatos del archivo. El contenido en línea de gran tamaño también se guarda localmente y se devuelve a través de
extract_path.Dos modos de transporte:
stdio,streamable-http
Variables de entorno
Variable | Descripción | Predeterminado |
| Token de la API de MinerU, solicítalo en MinerU para obtener la capacidad completa. Si no se proporciona, se habilita el modo flash. | — |
| Directorio utilizado cuando los resultados analizados deben guardarse localmente, como en el análisis por lotes o contenido en línea de gran tamaño |
|
Política de privacidad
mineru-open-mcp se conecta a la API oficial de MinerU (mineru.net) para analizar documentos.
Datos enviados: Contenido del documento (archivos o URLs que proporcionas para el análisis)
Almacenamiento de datos: Los resultados analizados son almacenados temporalmente en caché por los servidores de MinerU; no se utilizan para entrenamiento
Terceros: API de MinerU (mineru.net): consulta la Política de privacidad de MinerU
Datos locales: Los resultados analizados se guardarán en el directorio de salida de destino. Los archivos de registro (solo cuando ENABLE_LOG=true) se guardan en MINERU_LOG_DIR;
Contacto: OpenDataLab@pjlab.org.cn (o abre un issue en MinerU-Ecosystem )
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/opendatalab/MinerU-Ecosystem'
If you have feedback or need assistance with the MCP directory API, please join our Discord server