Integrations
Offers containerized deployment of the PDF server, with volume mounting capabilities to access and manage PDF files between host and container
Provides a web interface for managing PDF files, allowing users to upload, download, and view PDF files through a FastAPI-based web UI
MCP PDF Server
MCP PDF Serverは、PDFファイルを効率的に管理できるModel Context Protocol(MCP)ベースのサーバーです。
このプロジェクトは、組み込み開発者である私が、CursorなどのAIコーディングツールでPDFデータシート文書を直接読み、要約したり、クエリ応答などで開発業務をより便利にできるようにした。つまり、AIがPDFデータシートの内容をすばやく把握し、必要な情報をすぐに提供できるように支援することが主な目的です。
このプロジェクトは2つの主要コンポーネントで構成されています。
- manager_server :FastAPIベースのWebページで、ユーザーがWeb UIを通じてPDFファイルをアップロードまたはダウンロードし、ファイルリストを照会・管理する機能を提供します。また、外部システムとの連携のためのRESTful APIも付属しています。
- mcp_server : manager_serverで管理するPDFファイルに基づいて、ファイル名検索とテキスト抽出機能を提供します。抽出されたテキストは、MCPプロトコルを介して外部システム(Cursorなど)と連動できます。
主な機能:
- PDFテキストの抽出(ローカルファイルとURLのサポート)
- ファイル名ベースのPDF検索
- PDFリストの閲覧と管理
- PDFファイルのWebアップロード/ダウンロードのサポート
- RESTful APIとWebサービスの提供
- MCPプロトコルを介した外部システム(Curator、Cursorなど)の連動
RESTful APIとWeb UIを介して外部システムと簡単に連携でき、Dockerとローカル環境の両方で簡単にデプロイおよび操作できます。データシート・論文・契約書など様々なPDF文書の自動化された管理と検索に適しています。
主な特長
- ローカルPDFファイルとURLでアクセス可能なPDFからテキストを抽出する
/app/datasheets
の PDF ファイルリストを提供- ファイル名でPDF検索機能を提供
- PyPDF2ベースの安定したテキスト抽出と例外処理
- FastMCPベースの標準化されたMCPツールを提供
Dockerで実行する
- イメージビルドCopy
- コンテナの実行Copy
/호스트/경로/데이터
にPDFファイルを配置すると、コンテナ内の/app/datasheets
/datasheetsからアクセスできます。- 5050、5080ポートが使用されます。
- docker-composeを使用する場合Copy
ローカル(Python)で直接実行する
- 依存関係のインストールCopy
- サーバーの実行Copy
MCPツール(API)の説明
- read_local_pdf
ローカルPDFファイルパスを入力してテキストを抽出します。 - read_url_pdf
PDFファイルのURLを入力してテキストを抽出します。 - server_pdf_list
/app/datasheets
すべての PDF ファイルのリストを返します。 - server_pdf_search
ファイル名を入力してサーバー上のPDFファイルを検索し、そのPDFのテキストを抽出します。
ルートガイド
- PDFデータは
/app/datasheets
パス(ドッカーコンテナ内)に配置する必要があります。 - ドッカーを使用する場合は、ホストのPDFフォルダを
/app/datasheets
としてマウントしてください。 - ソースコードは
/app/mcp_server
にあります(コンテナの内部基準)。
ライセンス
Apache License 2.0
著者: Dev91
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
A Model Context Protocol (MCP) based server that efficiently manages PDF files, allowing AI coding tools like Cursor to read, summarize, and extract information from PDF datasheets to assist embedded development work.
Related MCP Servers
- AsecurityFlicenseAqualityA Model Context Protocol server that converts PDF documents into PNG images through a simple MCP tool call.Last updated -12Python
- -securityFlicense-qualityImplements the Model Context Protocol (MCP) to provide AI models with a standardized interface for connecting to external data sources and tools like file systems, databases, or APIs.Last updated -90Python
- -securityAlicense-qualityA Model Context Protocol (MCP) server that allows AI models to safely access and interact with local file systems, enabling reading file contents, listing directories, and retrieving file metadata.Last updated -471JavaScriptMIT License
- -security-license-qualityA Model Context Protocol (MCP) server that allows interaction with PDF and EPUB documents, designed to work with Windsurf IDE by Codeium.Last updated -3PythonMIT License