Skip to main content
Glama

PDF Processor MCP Server

PDFプロセッサMCPサーバー

LaTeXの数式抽出などの高度な機能を備えたPDF文書処理用のモデルコンテキストプロトコル(MCP)サーバー。このサーバーにより、ClaudeはLaTeXの数式を含むPDF文書から情報を取得、処理、抽出できます。

特徴

  • URLからのPDF取得
  • PDFからのテキスト抽出
  • LaTeX 数式の認識と抽出
  • MCP経由のClaudeとの統合

インストール

標準インストール

pip install -e .

Claude Desktop/Claude Code のインストール

この MCP サーバーを Claude Desktop または Claude Code で使用するには:

  1. MCP CLI ツールがまだインストールされていない場合はインストールします。
    pip install "mcp[cli]"
  2. MCP CLI ツールを使用してサーバーをインストールします。
    mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
    たとえば、このリポジトリを~/mcp_pdf_processorにクローンした場合:
    mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor
  3. MCP Inspector を使用した開発の場合:
    mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
  4. Claude Desktop では、次のコマンドを使用して会話で PDF_TOOLS サーバーを使用できるようになりました。
    /mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

使用法

スタンドアロン実行

python pdf_tool_server.py

環境変数

  • OUTPUT_DIR : 処理されたPDFを保存するディレクトリ(デフォルト: llm_output
  • PYTHONPATH : mcp_pdf_processor パッケージを含むディレクトリを設定します

クロードと一緒に使う

サーバーが登録されると、Claude に次のことを依頼できます。

  • [URL] の PDF を取得して分析する」
  • [URL]のPDFからLaTeXの数式を抽出します」
  • [URL]のPDFの内容を要約してください」

要件

サーバーには次の主な依存関係が必要です。

  • Python 3.9以上
  • pymupdf : PDF処理とテキスト抽出
  • mcp : モデルコンテキストプロトコルのサポート
  • pydantic : データの検証とシリアル化
  • aiohttp : 非同期 HTTP クライアント/サーバー
  • torch : LaTeX 数式抽出用(オプション)
  • pix2tex : LaTeX 数式認識用(オプション)

依存関係とバージョン要件の完全なリストについては、 pyproject.toml参照してください。

使用例

Claude Desktop で PDF プロセッサを使用するための完全なワークフローの例を次に示します。

# 1. Fetch a PDF without reading it /mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522 # This returns a hash_id, which you'll use in the next step # 2. Process the PDF with LaTeX extraction /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true # This returns a filename for the processed output # 3. Read the processed content /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME> # Now Claude can analyze the PDF content, including any LaTeX equations

ライセンス

マサチューセッツ工科大学

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Claude が LaTeX 数式を含む PDF ドキュメントから情報を取得、処理、抽出できるようにするモデル コンテキスト プロトコル サーバー。

  1. 特徴
    1. インストール
      1. 標準インストール
      2. Claude Desktop/Claude Code のインストール
    2. 使用法
      1. スタンドアロン実行
      2. 環境変数
      3. クロードと一緒に使う
    3. 要件
      1. 使用例
        1. ライセンス

          Related MCP Servers

          • -
            security
            A
            license
            -
            quality
            A Model Context Protocol server that allows Claude to create flashcards for Rember, helping users study and remember information through spaced repetition reviews.
            Last updated -
            88
            16
            TypeScript
            MIT License
          • -
            security
            A
            license
            -
            quality
            A Model Context Protocol server that integrates Claude with Blender, enabling users to analyze and interact with IFC (Industry Foundation Classes) building models through natural language commands.
            Last updated -
            9
            Python
            MIT License
            • Apple
          • -
            security
            F
            license
            -
            quality
            A Model Context Protocol server that allows Claude Desktop to perform document operations on Microsoft Word, Excel, and PDF files including creation, editing, and format conversion.
            Last updated -
            9
            Python
            • Apple
          • -
            security
            -
            license
            -
            quality
            A Model Context Protocol (MCP) server that converts LaTeX mathematical expressions to MathML format.
            Last updated -
            3
            JavaScript
            MIT License

          View all related MCP servers

          MCP directory API

          We provide all the information about MCP servers via our MCP API.

          curl -X GET 'https://glama.ai/api/mcp/v1/servers/MichaelLevinson/mcp_pdf_processor'

          If you have feedback or need assistance with the MCP directory API, please join our Discord server