Skip to main content
Glama

PDF Reader MCP Server

by trafflux

PDFリーダーMCPサーバー

ローカル ファイルと URL の両方をサポートし、PDF ファイルからテキストを読み取って抽出するためのツールを提供するモデル コンテキスト プロトコル (MCP) サーバー。

著者

フィリップ・ヴァン・デ・ウォーカー
メールアドレス: philip.vandewalker@gmail.com
GitHub: https://github.com/trafflux

特徴

  • ローカルのPDFファイルからテキストコンテンツを読み取る
  • PDF URL からテキスト コンテンツを読み取る
  • 破損または無効な PDF のエラー処理
  • ローカル PDF にアクセスするためのボリュームマウント
  • PDFエンコードの自動検出
  • 標準化されたJSON出力形式

インストール

  1. リポジトリをクローンします。
git clone https://github.com/trafflux/pdf-reader-mcp.git cd pdf-reader-mcp
  1. Docker イメージをビルドします。
docker build -t mcp/pdf-reader .

使用法

サーバーの実行

ローカル PDF ファイルにアクセスしてサーバーを実行するには:

docker run -i --rm -v /path/to/pdfs:/pdfs mcp/pdf-reader

/path/to/pdfs PDF ファイル ディレクトリへの実際のパスに置き換えます。

ローカル PDF ファイルを使用しない場合:

docker run -i --rm mcp/pdf-reader

MCP構成

MCP 設定構成に追加します:

{ "mcpServers": { "pdf-reader": { "command": "docker", "args": [ "run", "-i", "--rm", "-v", "/path/to/pdfs:/pdfs", "mcp/pdf-reader" ], "disabled": false, "autoApprove": [] } } }

ローカルファイルなしの PDF ファイル:

{ "mcpServers": { "pdf-reader": { "command": "docker", "args": ["run", "-i", "--rm", "mcp/pdf-reader"], "disabled": false, "autoApprove": [] } } }

利用可能なツール

  1. read_local_pdf
    • 目的: ローカルのPDFファイルからテキストコンテンツを読み取る
    • 入力:
      { "path": "/pdfs/document.pdf" }
    • 出力:
      { "success": true, "data": { "text": "Extracted content..." } }
  2. read_pdf_url
    • 目的: PDF URL からテキスト コンテンツを読み取る
    • 入力:
      { "url": "https://example.com/document.pdf" }
    • 出力:
      { "success": true, "data": { "text": "Extracted content..." } }

エラー処理

サーバーは、明確なエラー メッセージを使用してさまざまなエラー ケースを処理します。

  • 無効または破損したPDFファイル
  • 不足しているファイル
  • 失敗したURLリクエスト
  • 権限の問題
  • ネットワーク接続の問題

エラー応答は次の形式に従います。

{ "success": false, "error": "Detailed error message" }

依存関係

  • Python 3.11以上
  • PyPDF2: PDF解析とテキスト抽出
  • リクエスト: URLからPDFを取得するためのHTTPクライアント
  • MCP SDK: モデルコンテキストプロトコルの実装

プロジェクト構造

. ├── Dockerfile # Container configuration ├── README.md # This documentation ├── requirements.txt # Python dependencies └── src/ ├── __init__.py # Package initialization └── server.py # Main server implementation

ライセンス

Copyright 2025 フィリップ・ヴァン・デ・ウォーカー

Apacheライセンス バージョン2.0(以下「ライセンス」)に基づいてライセンスされています。このファイルは、ライセンスに従わない限り使用できません。ライセンスのコピーは以下から入手できます。

http://www.apache.org/licenses/LICENSE-2.0

適用法によって義務付けられている場合、または書面による合意がある場合を除き、本ライセンスに基づいて配布されるソフトウェアは、「現状有姿」で配布され、明示的または黙示的を問わず、いかなる種類の保証または条件も付与されません。本ライセンスに基づく許可および制限事項を規定する具体的な文言については、本ライセンスを参照してください。

貢献

貢献を歓迎します!お気軽にプルリクエストを送信してください。

接触

ご質問、問題、または貢献については、Philip Van de Walker までお問い合わせください。

-
security - not tested
F
license - not found
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

ローカル ファイルと URL の両方をサポートし、PDF ファイルからテキストを読み取って抽出するためのツールを提供します。

  1. 著者
    1. 特徴
      1. インストール
        1. 使用法
          1. サーバーの実行
          2. MCP構成
          3. 利用可能なツール
        2. エラー処理
          1. 依存関係
            1. プロジェクト構造
              1. ライセンス
                1. 貢献
                  1. 接触

                    Related MCP Servers

                    • A
                      security
                      A
                      license
                      A
                      quality
                      Enables text extraction from web pages and PDFs, and execution of predefined commands, enhancing content processing and automation capabilities.
                      Last updated -
                      3
                      TypeScript
                      MIT License
                    • A
                      security
                      A
                      license
                      A
                      quality
                      Provides comprehensive document processing, including reading, converting, and manipulating various document formats with advanced text and HTML processing capabilities.
                      Last updated -
                      16
                      231
                      11
                      TypeScript
                      MIT License
                    • -
                      security
                      F
                      license
                      -
                      quality
                      A server providing PDF form manipulation tools via MCP's API, allowing users to find PDFs across directories, extract form field information, and visualize form fields in documents.
                      Last updated -
                      Python
                    • A
                      security
                      F
                      license
                      A
                      quality
                      An MCP server that provides a tool to extract text content from local PDF files, supporting both standard PDF reading and OCR capabilities with optional page selection.
                      Last updated -
                      1
                      6
                      Python
                      • Apple

                    View all related MCP servers

                    MCP directory API

                    We provide all the information about MCP servers via our MCP API.

                    curl -X GET 'https://glama.ai/api/mcp/v1/servers/trafflux/pdf-reader-mcp'

                    If you have feedback or need assistance with the MCP directory API, please join our Discord server