Skip to main content
Glama

PDFプロセッサMCPサーバー

LaTeXの数式抽出などの高度な機能を備えたPDF文書処理用のモデルコンテキストプロトコル(MCP)サーバー。このサーバーにより、ClaudeはLaTeXの数式を含むPDF文書から情報を取得、処理、抽出できます。

特徴

  • URLからのPDF取得

  • PDFからのテキスト抽出

  • LaTeX 数式の認識と抽出

  • MCP経由のClaudeとの統合

Related MCP server: MCP Web Research Server

インストール

標準インストール

pip install -e .

Claude Desktop/Claude Code のインストール

この MCP サーバーを Claude Desktop または Claude Code で使用するには:

  1. MCP CLI ツールがまだインストールされていない場合はインストールします。

    pip install "mcp[cli]"
  2. MCP CLI ツールを使用してサーバーをインストールします。

    mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor

    たとえば、このリポジトリを~/mcp_pdf_processorにクローンした場合:

    mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor
  3. MCP Inspector を使用した開発の場合:

    mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
  4. Claude Desktop では、次のコマンドを使用して会話で PDF_TOOLS サーバーを使用できるようになりました。

    /mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf
    /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true
    /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

使用法

スタンドアロン実行

python pdf_tool_server.py

環境変数

  • OUTPUT_DIR : 処理されたPDFを保存するディレクトリ(デフォルト: llm_output

  • PYTHONPATH : mcp_pdf_processor パッケージを含むディレクトリを設定します

クロードと一緒に使う

サーバーが登録されると、Claude に次のことを依頼できます。

  • 「[URL] の PDF を取得して分析する」

  • 「[URL]のPDFからLaTeXの数式を抽出します」

  • 「[URL]のPDFの内容を要約してください」

要件

サーバーには次の主な依存関係が必要です。

  • Python 3.9以上

  • pymupdf : PDF処理とテキスト抽出

  • mcp : モデルコンテキストプロトコルのサポート

  • pydantic : データの検証とシリアル化

  • aiohttp : 非同期 HTTP クライアント/サーバー

  • torch : LaTeX 数式抽出用(オプション)

  • pix2tex : LaTeX 数式認識用(オプション)

依存関係とバージョン要件の完全なリストについては、 pyproject.toml参照してください。

使用例

Claude Desktop で PDF プロセッサを使用するための完全なワークフローの例を次に示します。

# 1. Fetch a PDF without reading it
/mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522

# This returns a hash_id, which you'll use in the next step

# 2. Process the PDF with LaTeX extraction
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true

# This returns a filename for the processed output

# 3. Read the processed content
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

# Now Claude can analyze the PDF content, including any LaTeX equations

ライセンス

マサチューセッツ工科大学

A
license - permissive license
-
quality - not tested
C
maintenance

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/MichaelLevinson/mcp_pdf_processor'

If you have feedback or need assistance with the MCP directory API, please join our Discord server