PDFプロセッサMCPサーバー

LaTeXの数式抽出などの高度な機能を備えたPDF文書処理用のモデルコンテキストプロトコル（MCP）サーバー。このサーバーにより、ClaudeはLaTeXの数式を含むPDF文書から情報を取得、処理、抽出できます。

特徴

URLからのPDF取得
PDFからのテキスト抽出
LaTeX 数式の認識と抽出
MCP経由のClaudeとの統合

Related MCP server: MCP Web Research Server

インストール

標準インストール

pip install -e .

Claude Desktop/Claude Code のインストール

この MCP サーバーを Claude Desktop または Claude Code で使用するには:

MCP CLI ツールがまだインストールされていない場合はインストールします。
```
pip install "mcp[cli]"
```

MCP CLI ツールを使用してサーバーをインストールします。

mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor

たとえば、このリポジトリを~/mcp_pdf_processorにクローンした場合:

mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor

MCP Inspector を使用した開発の場合:

mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor

Claude Desktop では、次のコマンドを使用して会話で PDF_TOOLS サーバーを使用できるようになりました。

/mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

使用法

スタンドアロン実行

python pdf_tool_server.py

環境変数

OUTPUT_DIR : 処理されたPDFを保存するディレクトリ（デフォルト: llm_output ）
PYTHONPATH : mcp_pdf_processor パッケージを含むディレクトリを設定します

クロードと一緒に使う

サーバーが登録されると、Claude に次のことを依頼できます。

「[URL] の PDF を取得して分析する」
「[URL]のPDFからLaTeXの数式を抽出します」
「[URL]のPDFの内容を要約してください」

要件

サーバーには次の主な依存関係が必要です。

Python 3.9以上
pymupdf : PDF処理とテキスト抽出
mcp : モデルコンテキストプロトコルのサポート
pydantic : データの検証とシリアル化
aiohttp : 非同期 HTTP クライアント/サーバー
torch : LaTeX 数式抽出用（オプション）
pix2tex : LaTeX 数式認識用（オプション）

依存関係とバージョン要件の完全なリストについては、 pyproject.toml参照してください。

使用例

Claude Desktop で PDF プロセッサを使用するための完全なワークフローの例を次に示します。

# 1. Fetch a PDF without reading it
/mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522

# This returns a hash_id, which you'll use in the next step

# 2. Process the PDF with LaTeX extraction
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true

# This returns a filename for the processed output

# 3. Read the processed content
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

# Now Claude can analyze the PDF content, including any LaTeX equations

ライセンス

マサチューセッツ工科大学

This server cannot be installed

A

license - permissive license

-

quality - not tested

C

maintenance

How are these scores calculated?

Resources

GitHub Repository

Need Help?

Related Servers

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

PDF Processor MCP Server