MCP PDF-сервер
MCP PDF Server — это сервер на основе протокола контекстной модели (MCP), который может эффективно управлять PDF-файлами.
Этот проект был создан для того, чтобы мне, разработчику встроенных систем, было проще читать и резюмировать документы PDF-таблиц непосредственно в инструментах кодирования ИИ, таких как Cursor, или проводить вопросы и ответы, чтобы сделать процесс разработки более удобным. Другими словами, основная цель — помочь ИИ быстро понять содержание PDF-файлов и немедленно предоставить необходимую информацию.
Этот проект состоит из двух основных компонентов:
manager_server : веб-страница на основе FastAPI, которая предоставляет пользователям возможность загружать или скачивать файлы PDF, а также просматривать и управлять списками файлов через веб-интерфейс. Он также предоставляет RESTful API для интеграции с внешними системами.
mcp_server : предоставляет функции поиска по имени файла и извлечения текста на основе PDF-файлов, управляемых manager_server. Извлеченный текст можно связать с внешними системами (например, Cursor и т. д.) через протокол MCP.
Основные характеристики:
Извлечение текста PDF (поддерживает локальные файлы и URL-адреса)
Поиск PDF по имени файла
Просмотр и управление списками PDF-файлов
Поддерживает загрузку/выгрузку PDF-файлов через Интернет
Предоставление RESTful API и веб-сервисов
Возможность подключения к внешним системам (Curator, Cursor и т.д.) по протоколу MCP
Его можно легко интегрировать с внешними системами через RESTful API и веб-интерфейс, а также легко развертывать и эксплуатировать как в Docker, так и в локальных средах. Подходит для автоматизированного управления и поиска различных PDF-документов, таких как технические паспорта, статьи и контракты.
Основные характеристики
Извлечение текста из локальных PDF-файлов и PDF-файлов, доступных по URL-адресу
Предоставляет список PDF-файлов в
/app/datasheetsПредоставляет функцию поиска PDF-файлов по имени файла
Надежное извлечение текста и обработка исключений на основе PyPDF2
Предоставление стандартизированных инструментов MCP на основе FastMCP
Related MCP server: File MCP Server
Работа с Docker
Создать изображение
docker build -t mcp-pdf-server:1.0.0 .Запуск контейнера
docker run -d \ -v /호스트/경로/데이터:/app/datasheets \ -p 5050:5050 \ -p 5080:5080 \ --name mcp-pdf-server \ mcp-pdf-server:1.0.0Если вы поместите PDF-файл в
/호스트/경로/데이터вы сможете получить к нему доступ из/app/datasheetsвнутри контейнера.Используются порты 5050 и 5080.
При использовании docker-compose
# docker-compose.yml의 /path/to/your/datasheets를 실제 PDF 폴더 경로로 수정하세요. docker-compose up -d --build
Запуск непосредственно локально (Python)
Установка зависимостей
pip install -r requirements.txtЗапуск сервера
python mcp_server/mcp_pdf_server.py # 또는 uvicorn manager_server.main:app --host 0.0.0.0 --port 5080
Описание инструмента MCP (API)
read_local_pdf
Извлеките текст, указав путь к локальному PDF-файлу.read_url_pdf
Введите URL-адрес PDF-файла и извлеките из него текст.список_pdf_серверов
Возвращает список всех PDF-файлов в каталоге/app/datasheets.сервер_pdf_поиск
Введите имя файла, найдите PDF-файл на сервере и извлеките текст из этого PDF-файла.
Руководство по маршруту
Данные PDF должны быть расположены по пути
/app/datasheets(внутри контейнера Docker).При использовании Docker смонтируйте папку PDF хоста в
/app/datasheets.Исходный код находится в
/app/mcp_server(внутри контейнера).
Лицензия
Лицензия Apache 2.0
Автор: Dev91