MinerU Open MCP (Official)
MinerU Open MCP
MinerUのドキュメント解析機能をMCPツールとして提供する公式MinerU MCPサーバーです。MCP対応のAIクライアントに接続することで、PDF、Wordドキュメント、PowerPointファイル、画像をMarkdownに変換できます。
APIキーは不要です — Flashモードは、20ページ/10MBまでのファイルに対して、登録不要で無料ですぐに使用できます。MINERU_API_TOKENを設定すると、制限の緩和や追加の出力形式が利用可能になります。
⚡ 最速の実行方法 — uvx (インストール不要)
mineru-open-mcpはPyPIで公開されています。uvがインストールされていれば、個別のインストール手順なしで直接実行できます。
MCPクライアントの設定
stdio — Claude Desktop, Cursor, Windsurf
MCPクライアントはmineru-open-mcpをサブプロセスとして自動的に起動します。
uvxを使用する場合(推奨 — 常に最新バージョンが実行されます):
{
"mcpServers": {
"mineru": {
"command": "uvx",
"args": ["mineru-open-mcp"],
"env": {
"MINERU_API_TOKEN": "your_key_here"
}
}
}
}APIキーをお持ちでない場合 サーバーはFlashモードで動作します。これは無料でMarkdownのみの出力となります。詳細はFlashモードのドキュメントをご覧ください。
mineru-open-mcpがPATHにない場合 フルパス(例:"/Users/you/.local/bin/mineru-open-mcp")を使用するか、上記のようにuvxアプローチを使用してください(自動的に処理されます)。
使用例
例1: ローカルのPDFドキュメントをページ範囲指定で解析する
ユーザープロンプト: "このPDFの3〜5ページ目をMarkdownに解析して: <your_path_to_file>" 動作:
MinerUがPDFをアップロードして解析します
テーブル(HTML)と数式(Latex)が保持されたクリーンなMarkdownを返します
長さが許容される場合はチャット内にMarkdownテキストを返し、出力パスやzipファイルのURLも提供します
MCPクライアントが内容を要約します
例2: ファイルをホストしているリモートURLを解析する
ユーザープロンプト: "この論文の内容を抽出して: https://arxiv.org/pdf/2509.22186" 動作:
MinerUが論文をMarkdownに解析します
MCPクライアントがテーブルを整形して解説します
例3: ローカルのPDFファイルを個別のページ範囲で解析する
ユーザープロンプト: "の1〜5ページ、の2〜9ページ、の3ページ目をMarkdownに解析して" 動作:
MinerUが各ファイルを個別にアップロードして解析します
指定された形式の出力、ダウンロード用のzip URL、Markdownの要約、保存先のディレクトリを返します
MCPクライアントがその内容をさらなる分析に使用します
例4: 高度なカスタム設定
ユーザープロンプト1: "パイプラインモデルを使ってこの韓国語ファイルを解析して your_path_here" ユーザープロンプト2: "your_path_hereを解析してMarkdownをyour_output_dirに保存して" 動作:
パイプラインモデルはMinerUサービスが提供する別のモデルです(ちなみに、デフォルトはvlmモデルです)
プロンプトを構成することで、モデルの指定、OCR言語の指定、あるいはOUTPUT_DIRとは異なる独立した出力ディレクトリの指定が可能です
リクエストは
parse_documentsツールにパラメータ化され、MinerUが残りの処理を行います。
streamable-http — WebベースのMCPクライアント
サーバーを手動で起動し、クライアントから接続先を指定します:
MINERU_API_TOKEN=your_key mineru-open-mcp --transport streamable-http --port 8001{
"mcpServers": {
"mineru": {
"type": "streamableHttp",
"url": "http://127.0.0.1:8001/mcp"
}
}
}機能
parse_documents— ローカルファイルやリモートURLをMarkdownに変換します。入力はPDF、画像(png/jpg/jpeg/jp2/webp/gif/bmp)、Doc、Docx、Ppt、PPTxをサポートしています。Flashモードはxlsxもサポートしています。get_ocr_languages— MinerUがサポートするすべてのOCR言語をリストアップしますFlashモード — APIキーなしで動作します(無料、Markdown出力のみ、PDF/画像/Docx/PPTx/xls/xlsxをサポート)。すべての機能を利用するには
MINERU_API_TOKENを提供してください。提供するとFlashモードは無効になります。出力動作 — 単一ファイルの解析はデフォルトでインラインMarkdownを返します。バッチ解析は結果をディスクに保存し、ファイルメタデータを返します。インラインで収まらない大きなコンテンツもローカルに保存され、
extract_path経由で返されます。2つの転送モード —
stdio、streamable-http
環境変数
変数 | 説明 | デフォルト |
| MinerU APIトークン。フル機能を利用するにはMinerUで申請してください。指定がない場合はFlashモードが有効になります。 | — |
| バッチ解析やインラインで収まらないコンテンツなど、解析結果をローカルに保存する際のディレクトリ |
|
プライバシーポリシー
mineru-open-mcpは、ドキュメントを解析するために公式のMinerU API (mineru.net) に接続します。
送信データ: ドキュメントの内容(解析のために提供したファイルまたはURL)
データ保存: 解析結果はMinerUサーバーによって一時的にキャッシュされますが、学習には使用されません
サードパーティ: MinerU API (mineru.net) — MinerUプライバシーポリシーを参照してください
ローカルデータ: 解析結果は指定された出力ディレクトリに保存されます。ログファイル(ENABLE_LOG=trueの場合のみ)はMINERU_LOG_DIRに保存されます。
連絡先: OpenDataLab@pjlab.org.cn (またはMinerU-EcosystemでIssueを作成してください)
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/opendatalab/MinerU-Ecosystem'
If you have feedback or need assistance with the MCP directory API, please join our Discord server