Skip to main content
Glama

PDFプロセッサMCPサーバー

LaTeXの数式抽出などの高度な機能を備えたPDF文書処理用のモデルコンテキストプロトコル(MCP)サーバー。このサーバーにより、ClaudeはLaTeXの数式を含むPDF文書から情報を取得、処理、抽出できます。

特徴

  • URLからのPDF取得

  • PDFからのテキスト抽出

  • LaTeX 数式の認識と抽出

  • MCP経由のClaudeとの統合

インストール

標準インストール

pip install -e .

Claude Desktop/Claude Code のインストール

この MCP サーバーを Claude Desktop または Claude Code で使用するには:

  1. MCP CLI ツールがまだインストールされていない場合はインストールします。

    pip install "mcp[cli]"
  2. MCP CLI ツールを使用してサーバーをインストールします。

    mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor

    たとえば、このリポジトリを~/mcp_pdf_processorにクローンした場合:

    mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor
  3. MCP Inspector を使用した開発の場合:

    mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
  4. Claude Desktop では、次のコマンドを使用して会話で PDF_TOOLS サーバーを使用できるようになりました。

    /mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

使用法

スタンドアロン実行

python pdf_tool_server.py

環境変数

  • OUTPUT_DIR : 処理されたPDFを保存するディレクトリ(デフォルト: llm_output

  • PYTHONPATH : mcp_pdf_processor パッケージを含むディレクトリを設定します

クロードと一緒に使う

サーバーが登録されると、Claude に次のことを依頼できます。

  • 「[URL] の PDF を取得して分析する」

  • 「[URL]のPDFからLaTeXの数式を抽出します」

  • 「[URL]のPDFの内容を要約してください」

要件

サーバーには次の主な依存関係が必要です。

  • Python 3.9以上

  • pymupdf : PDF処理とテキスト抽出

  • mcp : モデルコンテキストプロトコルのサポート

  • pydantic : データの検証とシリアル化

  • aiohttp : 非同期 HTTP クライアント/サーバー

  • torch : LaTeX 数式抽出用(オプション)

  • pix2tex : LaTeX 数式認識用(オプション)

依存関係とバージョン要件の完全なリストについては、 pyproject.toml参照してください。

使用例

Claude Desktop で PDF プロセッサを使用するための完全なワークフローの例を次に示します。

# 1. Fetch a PDF without reading it /mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522 # This returns a hash_id, which you'll use in the next step # 2. Process the PDF with LaTeX extraction /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true # This returns a filename for the processed output # 3. Read the processed content /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME> # Now Claude can analyze the PDF content, including any LaTeX equations

ライセンス

マサチューセッツ工科大学

-
security - not tested
A
license - permissive license
-
quality - not tested

Related MCP Servers

  • A
    security
    A
    license
    A
    quality
    Model Context Protocol server that enables Claude Desktop (or any MCP client) to fetch web content and process images appropriately.
    Last updated -
    1
    169
    MIT License
    • Apple
  • A
    security
    A
    license
    A
    quality
    A Model Context Protocol server that enables Claude to perform web research by integrating Google search, extracting webpage content, and capturing screenshots.
    Last updated -
    3
    259
    17
    MIT License
    • Apple
  • A
    security
    A
    license
    A
    quality
    A Model Context Protocol server that enables Claude to perform advanced web research with intelligent search queuing, enhanced content extraction, and deep research capabilities.
    Last updated -
    3
    6
    1
    MIT License
    • Apple
  • A
    security
    A
    license
    A
    quality
    A Model Context Protocol (MCP) server that enables Claude or other LLMs to fetch content from URLs, supporting HTML, JSON, text, and images with configurable request parameters.
    Last updated -
    3
    2
    MIT License

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/MichaelLevinson/mcp_pdf_processor'

If you have feedback or need assistance with the MCP directory API, please join our Discord server