Skip to main content
Glama

MinerU Open MCP

MinerUのドキュメント解析機能をMCPツールとして提供する公式MinerU MCPサーバーです。MCP対応のAIクライアントに接続することで、PDF、Wordドキュメント、PowerPointファイル、画像をMarkdownに変換できます。

APIキーは不要です — Flashモードは、20ページ/10MBまでのファイルに対して、登録不要で無料ですぐに使用できます。MINERU_API_TOKENを設定すると、制限の緩和や追加の出力形式が利用可能になります。


⚡ 最速の実行方法 — uvx (インストール不要)

mineru-open-mcpはPyPIで公開されています。uvがインストールされていれば、個別のインストール手順なしで直接実行できます。

MCPクライアントの設定

stdio — Claude Desktop, Cursor, Windsurf

MCPクライアントはmineru-open-mcpをサブプロセスとして自動的に起動します。

uvxを使用する場合(推奨 — 常に最新バージョンが実行されます):

{
  "mcpServers": {
    "mineru": {
      "command": "uvx",
      "args": ["mineru-open-mcp"],
      "env": {
        "MINERU_API_TOKEN": "your_key_here"
      }
    }
  }
}

APIキーをお持ちでない場合 サーバーはFlashモードで動作します。これは無料でMarkdownのみの出力となります。詳細はFlashモードのドキュメントをご覧ください。

mineru-open-mcpがPATHにない場合 フルパス(例: "/Users/you/.local/bin/mineru-open-mcp")を使用するか、上記のようにuvxアプローチを使用してください(自動的に処理されます)。

使用例

例1: ローカルのPDFドキュメントをページ範囲指定で解析する

ユーザープロンプト: "このPDFの3〜5ページ目をMarkdownに解析して: <your_path_to_file>" 動作:

  • MinerUがPDFをアップロードして解析します

  • テーブル(HTML)と数式(Latex)が保持されたクリーンなMarkdownを返します

  • 長さが許容される場合はチャット内にMarkdownテキストを返し、出力パスやzipファイルのURLも提供します

  • MCPクライアントが内容を要約します

例2: ファイルをホストしているリモートURLを解析する

ユーザープロンプト: "この論文の内容を抽出して: https://arxiv.org/pdf/2509.22186" 動作:

  • MinerUが論文をMarkdownに解析します

  • MCPクライアントがテーブルを整形して解説します

例3: ローカルのPDFファイルを個別のページ範囲で解析する

ユーザープロンプト: "の1〜5ページ、の2〜9ページ、の3ページ目をMarkdownに解析して" 動作:

  • MinerUが各ファイルを個別にアップロードして解析します

  • 指定された形式の出力、ダウンロード用のzip URL、Markdownの要約、保存先のディレクトリを返します

  • MCPクライアントがその内容をさらなる分析に使用します

例4: 高度なカスタム設定

ユーザープロンプト1: "パイプラインモデルを使ってこの韓国語ファイルを解析して your_path_here" ユーザープロンプト2: "your_path_hereを解析してMarkdownをyour_output_dirに保存して" 動作:

  • パイプラインモデルはMinerUサービスが提供する別のモデルです(ちなみに、デフォルトはvlmモデルです)

  • プロンプトを構成することで、モデルの指定、OCR言語の指定、あるいはOUTPUT_DIRとは異なる独立した出力ディレクトリの指定が可能です

  • リクエストはparse_documentsツールにパラメータ化され、MinerUが残りの処理を行います。

streamable-http — WebベースのMCPクライアント

サーバーを手動で起動し、クライアントから接続先を指定します:

MINERU_API_TOKEN=your_key mineru-open-mcp --transport streamable-http --port 8001
{
  "mcpServers": {
    "mineru": {
      "type": "streamableHttp",
      "url": "http://127.0.0.1:8001/mcp"
    }
  }
}

機能

  • parse_documents — ローカルファイルやリモートURLをMarkdownに変換します。入力はPDF、画像(png/jpg/jpeg/jp2/webp/gif/bmp)、Doc、Docx、Ppt、PPTxをサポートしています。Flashモードはxlsxもサポートしています。

  • get_ocr_languages — MinerUがサポートするすべてのOCR言語をリストアップします

  • Flashモード — APIキーなしで動作します(無料、Markdown出力のみ、PDF/画像/Docx/PPTx/xls/xlsxをサポート)。すべての機能を利用するにはMINERU_API_TOKENを提供してください。提供するとFlashモードは無効になります。

  • 出力動作 — 単一ファイルの解析はデフォルトでインラインMarkdownを返します。バッチ解析は結果をディスクに保存し、ファイルメタデータを返します。インラインで収まらない大きなコンテンツもローカルに保存され、extract_path経由で返されます。

  • 2つの転送モードstdiostreamable-http


環境変数

変数

説明

デフォルト

MINERU_API_TOKEN

MinerU APIトークン。フル機能を利用するにはMinerUで申請してください。指定がない場合はFlashモードが有効になります。

OUTPUT_DIR

バッチ解析やインラインで収まらないコンテンツなど、解析結果をローカルに保存する際のディレクトリ

~/mineru-downloads

プライバシーポリシー

mineru-open-mcpは、ドキュメントを解析するために公式のMinerU API (mineru.net) に接続します。

  • 送信データ: ドキュメントの内容(解析のために提供したファイルまたはURL)

  • データ保存: 解析結果はMinerUサーバーによって一時的にキャッシュされますが、学習には使用されません

  • サードパーティ: MinerU API (mineru.net) — MinerUプライバシーポリシーを参照してください

  • ローカルデータ: 解析結果は指定された出力ディレクトリに保存されます。ログファイル(ENABLE_LOG=trueの場合のみ)はMINERU_LOG_DIRに保存されます。

  • 連絡先: OpenDataLab@pjlab.org.cn (またはMinerU-EcosystemでIssueを作成してください)

Install Server
A
security – no known vulnerabilities
A
license - permissive license
C
quality - C tier

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/opendatalab/MinerU-Ecosystem'

If you have feedback or need assistance with the MCP directory API, please join our Discord server