Integrations
Offers containerized deployment of the PDF server, with volume mounting capabilities to access and manage PDF files between host and container
Provides a web interface for managing PDF files, allowing users to upload, download, and view PDF files through a FastAPI-based web UI
MCP PDF 服务器
MCP PDF 服务器是一个基于模型上下文协议 (MCP) 的服务器,可以有效地管理 PDF 文件。
这个项目是为了方便我这个嵌入式开发者,直接在Cursor等AI编程工具中阅读、汇总PDF datasheet文档,或者进行问答,让开发工作更加便捷而创建的。换句话说,主要目的是支持AI快速理解PDF数据表的内容并立即提供必要的信息。
该项目由两个主要部分组成:
- manager_server :基于 FastAPI 的网页,为用户提供通过 Web UI 上传或下载 PDF 文件以及查看和管理文件列表的功能。它还提供了用于与外部系统集成的 RESTful API。
- mcp_server :根据 manager_server 管理的 PDF 文件提供文件名搜索和文本提取功能。提取的文本可以通过 MCP 协议链接到外部系统(例如 Cursor 等)。
主要特点:
- 提取 PDF 文本(支持本地文件和 URL)
- 根据文件名搜索 PDF
- 查看和管理 PDF 列表
- 支持PDF文件网页上传/下载
- 提供 RESTful API 和 Web 服务
- 通过 MCP 协议连接到外部系统(Curator、Cursor 等)
它可以通过RESTful API和Web UI轻松地与外部系统集成,并可以在Docker和本地环境中轻松部署和运行。适用于数据表、论文、合同等各种PDF文档的自动化管理和检索。
主要特点
- 从本地 PDF 文件和可通过 URL 访问的 PDF 中提取文本
- 提供
/app/datasheets
下的 PDF 文件列表 - 提供按文件名搜索PDF的功能
- 基于 PyPDF2 的可靠文本提取和异常处理
- 提供基于FastMCP的标准化MCP工具
使用 Docker 运行
- 构建镜像Copy
- 运行容器Copy
- 如果您将 PDF 文件放在
/호스트/경로/데이터
则可以从容器内的/app/datasheets
访问它。 - 使用端口 5050 和 5080。
- 如果您将 PDF 文件放在
- 使用 docker-compose 时Copy
直接在本地运行(Python)
- 安装依赖项Copy
- 运行服务器Copy
MCP 工具(API)说明
- 读取本地PDF
通过输入本地 PDF 文件路径来提取文本。 - 阅读网址
输入 PDF 文件的 URL 并从中提取文本。 - 服务器 PDF 列表
返回/app/datasheets
下所有 PDF 文件的列表。 - 服务器 PDF 搜索
输入文件名,在服务器上搜索 PDF 文件,然后从该 PDF 文件中提取文本。
路线指引
- PDF 数据必须位于
/app/datasheets
路径(Docker 容器内)。 - 使用 Docker 时,将主机的 PDF 文件夹挂载到
/app/datasheets
。 - 源代码位于
/app/mcp_server
(容器内)。
执照
Apache 许可证 2.0
作者:Dev91
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
基于模型上下文协议 (MCP) 的服务器可以高效管理 PDF 文件,允许 Cursor 等 AI 编码工具读取、汇总和提取 PDF 数据表中的信息,以协助嵌入式开发工作。
Related MCP Servers
- AsecurityFlicenseAqualityA Model Context Protocol server that converts PDF documents into PNG images through a simple MCP tool call.Last updated -12Python
- -securityFlicense-qualityImplements the Model Context Protocol (MCP) to provide AI models with a standardized interface for connecting to external data sources and tools like file systems, databases, or APIs.Last updated -90Python
- -securityAlicense-qualityA Model Context Protocol (MCP) server that allows AI models to safely access and interact with local file systems, enabling reading file contents, listing directories, and retrieving file metadata.Last updated -471JavaScriptMIT License
- -security-license-qualityA Model Context Protocol (MCP) server that allows interaction with PDF and EPUB documents, designed to work with Windsurf IDE by Codeium.Last updated -3PythonMIT License