MinerU Open MCP (Official)
MinerU Open MCP
Официальный MCP-сервер MinerU, который предоставляет возможности парсинга документов MinerU в виде инструментов MCP. Подключите любой совместимый с MCP ИИ-клиент для преобразования PDF, документов Word, файлов PowerPoint и изображений в Markdown.
API-ключ не требуется — Flash-режим работает сразу «из коробки», бесплатно и без регистрации для файлов до 20 страниц / 10 МБ. Установите MINERU_API_TOKEN, чтобы разблокировать более высокие лимиты и дополнительные форматы вывода.
⚡ Самый быстрый способ запуска — uvx (установка не требуется)
mineru-open-mcp доступен в PyPI. Если у вас установлен uv, вы можете запустить его напрямую — без отдельного шага установки.
Настройка вашего MCP-клиента
stdio — Claude Desktop, Cursor, Windsurf
MCP-клиент автоматически запускает mineru-open-mcp как подпроцесс.
Использование uvx (рекомендуется — всегда запускает последнюю версию):
{
"mcpServers": {
"mineru": {
"command": "uvx",
"args": ["mineru-open-mcp"],
"env": {
"MINERU_API_TOKEN": "your_key_here"
}
}
}
}Нет API-ключа? Сервер работает в Flash-режиме — бесплатно, только markdown, подробнее в документации по Flash-режиму
mineru-open-mcpне найден в PATH? Используйте полный путь:"/Users/you/.local/bin/mineru-open-mcp"или используйте подход сuvxвыше, который обрабатывает это автоматически.
Примеры использования
Пример 1: Парсинг локального PDF-документа с указанием диапазона страниц
Запрос пользователя: "Преобразуй 3-5 страницы этого PDF в markdown: <ваш_путь_к_файлу>" Что происходит:
MinerU загружает и парсит PDF
Возвращает чистый Markdown с сохраненными таблицами (HTML) и формулами (Latex)
Возвращает текст в формате markdown в чат, если позволяет длина, вместе с путем к выходному файлу и ссылкой на zip-архив, если вы предпочитаете его
MCP-клиент суммирует содержимое
Пример 2: Парсинг удаленного URL с файлом
Запрос пользователя: "Извлеки содержимое из этой статьи: https://arxiv.org/pdf/2509.22186" Что происходит:
MinerU парсит статью в markdown
MCP-клиент форматирует и объясняет таблицы
Пример 3: Парсинг локальных PDF-файлов с независимыми диапазонами страниц
Запрос пользователя: "Преобразуй <файл1> страницы 1-5, <файл2> страницы 2-9, <файл3> страницу 3 в markdown" Что происходит:
MinerU загружает и парсит файлы по отдельности
Возвращает результаты в целевом формате, ссылку на zip-архив для скачивания, аннотацию в формате markdown и директорию, в которую вы хотите сохранить результат
MCP-клиент использует содержимое для дальнейшего анализа
Пример 4: Расширенные пользовательские настройки
Запрос пользователя 1: "используй модель pipeline для парсинга этого корейского файла ваш_путь_здесь" Запрос пользователя 2: "парси ваш_путь_здесь и сохрани markdown в ваш_выходной_каталог" Что происходит:
Модель Pipeline — это еще одна модель, предоставляемая сервисом MinerU (кстати, модель vlm является выбором по умолчанию)
Вы можете указать модель, язык OCR или даже отдельную выходную директорию, отличную от OUTPUT_DIR, структурируя свой запрос
Ваши запросы параметризуются в инструменте parse_documents, и MinerU берет на себя остальное.
streamable-http — веб-ориентированные MCP-клиенты
Запустите сервер вручную, затем укажите его адрес в клиенте:
MINERU_API_TOKEN=your_key mineru-open-mcp --transport streamable-http --port 8001{
"mcpServers": {
"mineru": {
"type": "streamableHttp",
"url": "http://127.0.0.1:8001/mcp"
}
}
}Функции
parse_documents— преобразование локальных файлов и/или удаленных URL в Markdown; поддерживаются PDF, изображения (png/jpg/jpeg/jp2/webp/gif/bmp), Doc, Docx, Ppt, PPTx. Flash-режим также поддерживает xlsx.get_ocr_languages— список всех языков OCR, поддерживаемых MinerUFlash-режим — работает без API-ключа (бесплатно, только вывод в markdown, поддерживает PDF/изображения/Docx/PPTx/xls/xlsx); для получения всех функций, пожалуйста, предоставьте
MINERU_API_TOKEN, что отключит flash-режим.Поведение вывода — парсинг одного файла по умолчанию возвращает Markdown в чате; пакетный парсинг сохраняет результаты на диск и возвращает метаданные файла. Слишком объемный контент также сохраняется локально и возвращается через
extract_path.Два транспортных режима —
stdio,streamable-http
Переменные окружения
Переменная | Описание | По умолчанию |
| API-токен MinerU, получите на MinerU для полной функциональности. Если не предоставлен, включен flash-режим. | — |
| Директория, используемая при необходимости сохранения результатов парсинга локально, например, при пакетном парсинге или для слишком объемного контента |
|
Политика конфиденциальности
mineru-open-mcp подключается к официальному API MinerU (mineru.net) для парсинга документов.
Отправляемые данные: Содержимое документа (файлы или URL, которые вы предоставляете для парсинга)
Хранение данных: Результаты парсинга временно кэшируются серверами MinerU; не используются для обучения
Сторонние сервисы: API MinerU (mineru.net) — см. Политику конфиденциальности MinerU
Локальные данные: Результаты парсинга будут сохранены в целевую выходную директорию. Файлы логов (только если ENABLE_LOG=true) сохраняются в MINERU_LOG_DIR;
Контакты: OpenDataLab@pjlab.org.cn (или создайте issue в MinerU-Ecosystem )
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/opendatalab/MinerU-Ecosystem'
If you have feedback or need assistance with the MCP directory API, please join our Discord server