Skip to main content
Glama

MinerU Open MCP

Официальный MCP-сервер MinerU, который предоставляет возможности парсинга документов MinerU в виде инструментов MCP. Подключите любой совместимый с MCP ИИ-клиент для преобразования PDF, документов Word, файлов PowerPoint и изображений в Markdown.

API-ключ не требуется — Flash-режим работает сразу «из коробки», бесплатно и без регистрации для файлов до 20 страниц / 10 МБ. Установите MINERU_API_TOKEN, чтобы разблокировать более высокие лимиты и дополнительные форматы вывода.


⚡ Самый быстрый способ запуска — uvx (установка не требуется)

mineru-open-mcp доступен в PyPI. Если у вас установлен uv, вы можете запустить его напрямую — без отдельного шага установки.

Настройка вашего MCP-клиента

stdio — Claude Desktop, Cursor, Windsurf

MCP-клиент автоматически запускает mineru-open-mcp как подпроцесс.

Использование uvx (рекомендуется — всегда запускает последнюю версию):

{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "your_key_here"
      }
    }
  }
}

Нет API-ключа? Сервер работает в Flash-режиме — бесплатно, только markdown, подробнее в документации по Flash-режиму

mineru-open-mcp не найден в PATH? Используйте полный путь: "/Users/you/.local/bin/mineru-open-mcp" или используйте подход с uvx выше, который обрабатывает это автоматически.

Примеры использования

Пример 1: Парсинг локального PDF-документа с указанием диапазона страниц

Запрос пользователя: "Преобразуй 3-5 страницы этого PDF в markdown: <ваш_путь_к_файлу>" Что происходит:

  • MinerU загружает и парсит PDF

  • Возвращает чистый Markdown с сохраненными таблицами (HTML) и формулами (Latex)

  • Возвращает текст в формате markdown в чат, если позволяет длина, вместе с путем к выходному файлу и ссылкой на zip-архив, если вы предпочитаете его

  • MCP-клиент суммирует содержимое

Пример 2: Парсинг удаленного URL с файлом

Запрос пользователя: "Извлеки содержимое из этой статьи: https://arxiv.org/pdf/2509.22186" Что происходит:

  • MinerU парсит статью в markdown

  • MCP-клиент форматирует и объясняет таблицы

Пример 3: Парсинг локальных PDF-файлов с независимыми диапазонами страниц

Запрос пользователя: "Преобразуй <файл1> страницы 1-5, <файл2> страницы 2-9, <файл3> страницу 3 в markdown" Что происходит:

  • MinerU загружает и парсит файлы по отдельности

  • Возвращает результаты в целевом формате, ссылку на zip-архив для скачивания, аннотацию в формате markdown и директорию, в которую вы хотите сохранить результат

  • MCP-клиент использует содержимое для дальнейшего анализа

Пример 4: Расширенные пользовательские настройки

Запрос пользователя 1: "используй модель pipeline для парсинга этого корейского файла ваш_путь_здесь" Запрос пользователя 2: "парси ваш_путь_здесь и сохрани markdown в ваш_выходной_каталог" Что происходит:

  • Модель Pipeline — это еще одна модель, предоставляемая сервисом MinerU (кстати, модель vlm является выбором по умолчанию)

  • Вы можете указать модель, язык OCR или даже отдельную выходную директорию, отличную от OUTPUT_DIR, структурируя свой запрос

  • Ваши запросы параметризуются в инструменте parse_documents, и MinerU берет на себя остальное.

streamable-http — веб-ориентированные MCP-клиенты

Запустите сервер вручную, затем укажите его адрес в клиенте:

MINERU_API_TOKEN=your_key mineru-open-mcp --transport streamable-http --port 8001
{
  "mcpServers": {
    "mineru": {
      "type": "streamableHttp",
      "url": "http://127.0.0.1:8001/mcp"
    }
  }
}

Функции

  • parse_documents — преобразование локальных файлов и/или удаленных URL в Markdown; поддерживаются PDF, изображения (png/jpg/jpeg/jp2/webp/gif/bmp), Doc, Docx, Ppt, PPTx. Flash-режим также поддерживает xlsx.

  • get_ocr_languages — список всех языков OCR, поддерживаемых MinerU

  • Flash-режим — работает без API-ключа (бесплатно, только вывод в markdown, поддерживает PDF/изображения/Docx/PPTx/xls/xlsx); для получения всех функций, пожалуйста, предоставьте MINERU_API_TOKEN, что отключит flash-режим.

  • Поведение вывода — парсинг одного файла по умолчанию возвращает Markdown в чате; пакетный парсинг сохраняет результаты на диск и возвращает метаданные файла. Слишком объемный контент также сохраняется локально и возвращается через extract_path.

  • Два транспортных режимаstdio, streamable-http


Переменные окружения

Переменная

Описание

По умолчанию

MINERU_API_TOKEN

API-токен MinerU, получите на MinerU для полной функциональности. Если не предоставлен, включен flash-режим.

OUTPUT_DIR

Директория, используемая при необходимости сохранения результатов парсинга локально, например, при пакетном парсинге или для слишком объемного контента

~/mineru-downloads

Политика конфиденциальности

mineru-open-mcp подключается к официальному API MinerU (mineru.net) для парсинга документов.

  • Отправляемые данные: Содержимое документа (файлы или URL, которые вы предоставляете для парсинга)

  • Хранение данных: Результаты парсинга временно кэшируются серверами MinerU; не используются для обучения

  • Сторонние сервисы: API MinerU (mineru.net) — см. Политику конфиденциальности MinerU

  • Локальные данные: Результаты парсинга будут сохранены в целевую выходную директорию. Файлы логов (только если ENABLE_LOG=true) сохраняются в MINERU_LOG_DIR;

  • Контакты: OpenDataLab@pjlab.org.cn (или создайте issue в MinerU-Ecosystem )

Install Server
A
security – no known vulnerabilities
A
license - permissive license
C
quality - C tier

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/opendatalab/MinerU-Ecosystem'

If you have feedback or need assistance with the MCP directory API, please join our Discord server