PDFプロセッサMCPサーバー
LaTeXの数式抽出などの高度な機能を備えたPDF文書処理用のモデルコンテキストプロトコル(MCP)サーバー。このサーバーにより、ClaudeはLaTeXの数式を含むPDF文書から情報を取得、処理、抽出できます。
特徴
URLからのPDF取得
PDFからのテキスト抽出
LaTeX 数式の認識と抽出
MCP経由のClaudeとの統合
インストール
標準インストール
Claude Desktop/Claude Code のインストール
この MCP サーバーを Claude Desktop または Claude Code で使用するには:
MCP CLI ツールがまだインストールされていない場合はインストールします。
pip install "mcp[cli]"MCP CLI ツールを使用してサーバーをインストールします。
mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorたとえば、このリポジトリを
~/mcp_pdf_processor
にクローンした場合:mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processorMCP Inspector を使用した開発の場合:
mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processorClaude Desktop では、次のコマンドを使用して会話で PDF_TOOLS サーバーを使用できるようになりました。
/mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>
使用法
スタンドアロン実行
環境変数
OUTPUT_DIR
: 処理されたPDFを保存するディレクトリ(デフォルト:llm_output
)PYTHONPATH
: mcp_pdf_processor パッケージを含むディレクトリを設定します
クロードと一緒に使う
サーバーが登録されると、Claude に次のことを依頼できます。
「[URL] の PDF を取得して分析する」
「[URL]のPDFからLaTeXの数式を抽出します」
「[URL]のPDFの内容を要約してください」
要件
サーバーには次の主な依存関係が必要です。
Python 3.9以上
pymupdf
: PDF処理とテキスト抽出mcp
: モデルコンテキストプロトコルのサポートpydantic
: データの検証とシリアル化aiohttp
: 非同期 HTTP クライアント/サーバーtorch
: LaTeX 数式抽出用(オプション)pix2tex
: LaTeX 数式認識用(オプション)
依存関係とバージョン要件の完全なリストについては、 pyproject.toml
参照してください。
使用例
Claude Desktop で PDF プロセッサを使用するための完全なワークフローの例を次に示します。
ライセンス
マサチューセッツ工科大学
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Claude が LaTeX 数式を含む PDF ドキュメントから情報を取得、処理、抽出できるようにするモデル コンテキスト プロトコル サーバー。
Related MCP Servers
- AsecurityAlicenseAqualityModel Context Protocol server that enables Claude Desktop (or any MCP client) to fetch web content and process images appropriately.Last updated -1106MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables Claude to perform web research by integrating Google search, extracting webpage content, and capturing screenshots.Last updated -315,70416MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables Claude to perform advanced web research with intelligent search queuing, enhanced content extraction, and deep research capabilities.Last updated -391MIT License
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server that enables Claude or other LLMs to fetch content from URLs, supporting HTML, JSON, text, and images with configurable request parameters.Last updated -32MIT License