PDFリーダーMCPサーバー

Name: PDF Reader MCP Server
Author: trafflux

ローカルファイルと URL の両方をサポートし、PDF ファイルからテキストを読み取って抽出するためのツールを提供するモデルコンテキストプロトコル (MCP) サーバー。

著者

フィリップ・ヴァン・デ・ウォーカー
メールアドレス: philip.vandewalker@gmail.com
GitHub: https://github.com/trafflux

Related MCP server: MCP PDF Server

特徴

ローカルのPDFファイルからテキストコンテンツを読み取る
PDF URL からテキストコンテンツを読み取る
破損または無効な PDF のエラー処理
ローカル PDF にアクセスするためのボリュームマウント
PDFエンコードの自動検出
標準化されたJSON出力形式

インストール

リポジトリをクローンします。

git clone https://github.com/trafflux/pdf-reader-mcp.git
cd pdf-reader-mcp

Docker イメージをビルドします。

docker build -t mcp/pdf-reader .

使用法

サーバーの実行

ローカル PDF ファイルにアクセスしてサーバーを実行するには:

docker run -i --rm -v /path/to/pdfs:/pdfs mcp/pdf-reader

/path/to/pdfs PDF ファイルディレクトリへの実際のパスに置き換えます。

ローカル PDF ファイルを使用しない場合:

docker run -i --rm mcp/pdf-reader

MCP構成

MCP 設定構成に追加します:

{
  "mcpServers": {
    "pdf-reader": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-v",
        "/path/to/pdfs:/pdfs",
        "mcp/pdf-reader"
      ],
      "disabled": false,
      "autoApprove": []
    }
  }
}

ローカルファイルなしの PDF ファイル:

{
  "mcpServers": {
    "pdf-reader": {
      "command": "docker",
      "args": ["run", "-i", "--rm", "mcp/pdf-reader"],
      "disabled": false,
      "autoApprove": []
    }
  }
}

利用可能なツール

read_local_pdf
- 目的: ローカルのPDFファイルからテキストコンテンツを読み取る
- 入力：
  { "path": "/pdfs/document.pdf" }
- 出力：
  { "success": true, "data": { "text": "Extracted content..." } }

read_pdf_url

目的: PDF URL からテキストコンテンツを読み取る

入力：

{
  "url": "https://example.com/document.pdf"
}

出力：

{
  "success": true,
  "data": {
    "text": "Extracted content..."
  }
}

エラー処理

サーバーは、明確なエラーメッセージを使用してさまざまなエラーケースを処理します。

無効または破損したPDFファイル
不足しているファイル
失敗したURLリクエスト
権限の問題
ネットワーク接続の問題

エラー応答は次の形式に従います。

{
  "success": false,
  "error": "Detailed error message"
}

依存関係

Python 3.11以上
PyPDF2: PDF解析とテキスト抽出
リクエスト: URLからPDFを取得するためのHTTPクライアント
MCP SDK: モデルコンテキストプロトコルの実装

プロジェクト構造

.
├── Dockerfile          # Container configuration
├── README.md          # This documentation
├── requirements.txt   # Python dependencies
└── src/
    ├── __init__.py    # Package initialization
    └── server.py      # Main server implementation

ライセンス

Apacheライセンスバージョン2.0（以下「ライセンス」）に基づいてライセンスされています。このファイルは、ライセンスに従わない限り使用できません。ライセンスのコピーは以下から入手できます。

http://www.apache.org/licenses/LICENSE-2.0

適用法によって義務付けられている場合、または書面による合意がある場合を除き、本ライセンスに基づいて配布されるソフトウェアは、「現状有姿」で配布され、明示的または黙示的を問わず、いかなる種類の保証または条件も付与されません。本ライセンスに基づく許可および制限事項を規定する具体的な文言については、本ライセンスを参照してください。