PDFリーダーMCPサーバー
ローカル ファイルと URL の両方をサポートし、PDF ファイルからテキストを読み取って抽出するためのツールを提供するモデル コンテキスト プロトコル (MCP) サーバー。
著者
フィリップ・ヴァン・デ・ウォーカー
メールアドレス: philip.vandewalker@gmail.com
GitHub: https://github.com/trafflux
特徴
- ローカルのPDFファイルからテキストコンテンツを読み取る
- PDF URL からテキスト コンテンツを読み取る
- 破損または無効な PDF のエラー処理
- ローカル PDF にアクセスするためのボリュームマウント
- PDFエンコードの自動検出
- 標準化されたJSON出力形式
インストール
- リポジトリをクローンします。
- Docker イメージをビルドします。
使用法
サーバーの実行
ローカル PDF ファイルにアクセスしてサーバーを実行するには:
/path/to/pdfs
PDF ファイル ディレクトリへの実際のパスに置き換えます。
ローカル PDF ファイルを使用しない場合:
MCP構成
MCP 設定構成に追加します:
ローカルファイルなしの PDF ファイル:
利用可能なツール
read_local_pdf
- 目的: ローカルのPDFファイルからテキストコンテンツを読み取る
- 入力:
- 出力:
read_pdf_url
- 目的: PDF URL からテキスト コンテンツを読み取る
- 入力:
- 出力:
エラー処理
サーバーは、明確なエラー メッセージを使用してさまざまなエラー ケースを処理します。
- 無効または破損したPDFファイル
- 不足しているファイル
- 失敗したURLリクエスト
- 権限の問題
- ネットワーク接続の問題
エラー応答は次の形式に従います。
依存関係
- Python 3.11以上
- PyPDF2: PDF解析とテキスト抽出
- リクエスト: URLからPDFを取得するためのHTTPクライアント
- MCP SDK: モデルコンテキストプロトコルの実装
プロジェクト構造
ライセンス
Copyright 2025 フィリップ・ヴァン・デ・ウォーカー
Apacheライセンス バージョン2.0(以下「ライセンス」)に基づいてライセンスされています。このファイルは、ライセンスに従わない限り使用できません。ライセンスのコピーは以下から入手できます。
適用法によって義務付けられている場合、または書面による合意がある場合を除き、本ライセンスに基づいて配布されるソフトウェアは、「現状有姿」で配布され、明示的または黙示的を問わず、いかなる種類の保証または条件も付与されません。本ライセンスに基づく許可および制限事項を規定する具体的な文言については、本ライセンスを参照してください。
貢献
貢献を歓迎します!お気軽にプルリクエストを送信してください。
接触
ご質問、問題、または貢献については、Philip Van de Walker までお問い合わせください。
- メールアドレス: philip.vandewalker@gmail.com
- GitHub: https://github.com/trafflux
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
ローカル ファイルと URL の両方をサポートし、PDF ファイルからテキストを読み取って抽出するためのツールを提供します。
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityEnables text extraction from web pages and PDFs, and execution of predefined commands, enhancing content processing and automation capabilities.Last updated -3TypeScriptMIT License
- AsecurityAlicenseAqualityProvides comprehensive document processing, including reading, converting, and manipulating various document formats with advanced text and HTML processing capabilities.Last updated -1623111TypeScriptMIT License
- -securityFlicense-qualityA server providing PDF form manipulation tools via MCP's API, allowing users to find PDFs across directories, extract form field information, and visualize form fields in documents.Last updated -Python
- AsecurityFlicenseAqualityAn MCP server that provides a tool to extract text content from local PDF files, supporting both standard PDF reading and OCR capabilities with optional page selection.Last updated -16Python