PDFリーダーMCPサーバー
ローカル ファイルと URL の両方をサポートし、PDF ファイルからテキストを読み取って抽出するためのツールを提供するモデル コンテキスト プロトコル (MCP) サーバー。
著者
フィリップ・ヴァン・デ・ウォーカー
メールアドレス: philip.vandewalker@gmail.com
GitHub: https://github.com/trafflux
Related MCP server: PDF Extraction MCP Server
特徴
ローカルのPDFファイルからテキストコンテンツを読み取る
PDF URL からテキスト コンテンツを読み取る
破損または無効な PDF のエラー処理
ローカル PDF にアクセスするためのボリュームマウント
PDFエンコードの自動検出
標準化されたJSON出力形式
インストール
リポジトリをクローンします。
Docker イメージをビルドします。
使用法
サーバーの実行
ローカル PDF ファイルにアクセスしてサーバーを実行するには:
/path/to/pdfs PDF ファイル ディレクトリへの実際のパスに置き換えます。
ローカル PDF ファイルを使用しない場合:
MCP構成
MCP 設定構成に追加します:
ローカルファイルなしの PDF ファイル:
利用可能なツール
read_local_pdf目的: ローカルのPDFファイルからテキストコンテンツを読み取る
入力:
{ "path": "/pdfs/document.pdf" }出力:
{ "success": true, "data": { "text": "Extracted content..." } }
read_pdf_url目的: PDF URL からテキスト コンテンツを読み取る
入力:
{ "url": "https://example.com/document.pdf" }出力:
{ "success": true, "data": { "text": "Extracted content..." } }
エラー処理
サーバーは、明確なエラー メッセージを使用してさまざまなエラー ケースを処理します。
無効または破損したPDFファイル
不足しているファイル
失敗したURLリクエスト
権限の問題
ネットワーク接続の問題
エラー応答は次の形式に従います。
依存関係
Python 3.11以上
PyPDF2: PDF解析とテキスト抽出
リクエスト: URLからPDFを取得するためのHTTPクライアント
MCP SDK: モデルコンテキストプロトコルの実装
プロジェクト構造
ライセンス
Copyright 2025 フィリップ・ヴァン・デ・ウォーカー
Apacheライセンス バージョン2.0(以下「ライセンス」)に基づいてライセンスされています。このファイルは、ライセンスに従わない限り使用できません。ライセンスのコピーは以下から入手できます。
適用法によって義務付けられている場合、または書面による合意がある場合を除き、本ライセンスに基づいて配布されるソフトウェアは、「現状有姿」で配布され、明示的または黙示的を問わず、いかなる種類の保証または条件も付与されません。本ライセンスに基づく許可および制限事項を規定する具体的な文言については、本ライセンスを参照してください。
貢献
貢献を歓迎します!お気軽にプルリクエストを送信してください。
接触
ご質問、問題、または貢献については、Philip Van de Walker までお問い合わせください。
メールアドレス: philip.vandewalker@gmail.com
GitHub: https://github.com/trafflux