Skip to main content
Glama

MCP PDF-сервер

MCP PDF Server — это сервер на основе протокола контекстной модели (MCP), который может эффективно управлять PDF-файлами.

Этот проект был создан для того, чтобы мне, разработчику встроенных систем, было проще читать и резюмировать документы PDF-таблиц непосредственно в инструментах кодирования ИИ, таких как Cursor, или проводить вопросы и ответы, чтобы сделать процесс разработки более удобным. Другими словами, основная цель — помочь ИИ быстро понять содержание PDF-файлов и немедленно предоставить необходимую информацию.

Этот проект состоит из двух основных компонентов:

  • manager_server : веб-страница на основе FastAPI, которая предоставляет пользователям возможность загружать или скачивать файлы PDF, а также просматривать и управлять списками файлов через веб-интерфейс. Он также предоставляет RESTful API для интеграции с внешними системами.

  • mcp_server : предоставляет функции поиска по имени файла и извлечения текста на основе PDF-файлов, управляемых manager_server. Извлеченный текст можно связать с внешними системами (например, Cursor и т. д.) через протокол MCP.

Основные характеристики:

  • Извлечение текста PDF (поддерживает локальные файлы и URL-адреса)

  • Поиск PDF по имени файла

  • Просмотр и управление списками PDF-файлов

  • Поддерживает загрузку/выгрузку PDF-файлов через Интернет

  • Предоставление RESTful API и веб-сервисов

  • Возможность подключения к внешним системам (Curator, Cursor и т.д.) по протоколу MCP

Его можно легко интегрировать с внешними системами через RESTful API и веб-интерфейс, а также легко развертывать и эксплуатировать как в Docker, так и в локальных средах. Подходит для автоматизированного управления и поиска различных PDF-документов, таких как технические паспорта, статьи и контракты.

Основные характеристики

  • Извлечение текста из локальных PDF-файлов и PDF-файлов, доступных по URL-адресу

  • Предоставляет список PDF-файлов в /app/datasheets

  • Предоставляет функцию поиска PDF-файлов по имени файла

  • Надежное извлечение текста и обработка исключений на основе PyPDF2

  • Предоставление стандартизированных инструментов MCP на основе FastMCP

Related MCP server: File MCP Server

Работа с Docker

  1. Создать изображение

    docker build -t mcp-pdf-server:1.0.0 .
  2. Запуск контейнера

    docker run -d \ -v /호스트/경로/데이터:/app/datasheets \ -p 5050:5050 \ -p 5080:5080 \ --name mcp-pdf-server \ mcp-pdf-server:1.0.0
    • Если вы поместите PDF-файл в /호스트/경로/데이터 вы сможете получить к нему доступ из /app/datasheets внутри контейнера.

    • Используются порты 5050 и 5080.

  3. При использовании docker-compose

    # docker-compose.yml의 /path/to/your/datasheets를 실제 PDF 폴더 경로로 수정하세요. docker-compose up -d --build

Запуск непосредственно локально (Python)

  1. Установка зависимостей

    pip install -r requirements.txt
  2. Запуск сервера

    python mcp_server/mcp_pdf_server.py # 또는 uvicorn manager_server.main:app --host 0.0.0.0 --port 5080

Описание инструмента MCP (API)

  • read_local_pdf
    Извлеките текст, указав путь к локальному PDF-файлу.

  • read_url_pdf
    Введите URL-адрес PDF-файла и извлеките из него текст.

  • список_pdf_серверов
    Возвращает список всех PDF-файлов в каталоге /app/datasheets .

  • сервер_pdf_поиск
    Введите имя файла, найдите PDF-файл на сервере и извлеките текст из этого PDF-файла.

Руководство по маршруту

  • Данные PDF должны быть расположены по пути /app/datasheets (внутри контейнера Docker).

  • При использовании Docker смонтируйте папку PDF хоста в /app/datasheets .

  • Исходный код находится в /app/mcp_server (внутри контейнера).

Лицензия

Лицензия Apache 2.0
Автор: Dev91

-
security - not tested
A
license - permissive license
-
quality - not tested

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/Dev-91/MCP_PDF_Server'

If you have feedback or need assistance with the MCP directory API, please join our Discord server