MCP PDF Server

by Dev-91

Integrations

  • Offers containerized deployment of the PDF server, with volume mounting capabilities to access and manage PDF files between host and container

  • Provides a web interface for managing PDF files, allowing users to upload, download, and view PDF files through a FastAPI-based web UI

MCP PDF-сервер

MCP PDF Server — это сервер на основе протокола контекстной модели (MCP), который может эффективно управлять PDF-файлами.

Этот проект был создан для того, чтобы мне, разработчику встроенных систем, было проще читать и резюмировать документы PDF-таблиц непосредственно в инструментах кодирования ИИ, таких как Cursor, или проводить вопросы и ответы, чтобы сделать процесс разработки более удобным. Другими словами, основная цель — помочь ИИ быстро понять содержание PDF-файлов и немедленно предоставить необходимую информацию.

Этот проект состоит из двух основных компонентов:

  • manager_server : веб-страница на основе FastAPI, которая предоставляет пользователям возможность загружать или скачивать файлы PDF, а также просматривать и управлять списками файлов через веб-интерфейс. Он также предоставляет RESTful API для интеграции с внешними системами.
  • mcp_server : предоставляет функции поиска по имени файла и извлечения текста на основе PDF-файлов, управляемых manager_server. Извлеченный текст можно связать с внешними системами (например, Cursor и т. д.) через протокол MCP.

Основные характеристики:

  • Извлечение текста PDF (поддерживает локальные файлы и URL-адреса)
  • Поиск PDF по имени файла
  • Просмотр и управление списками PDF-файлов
  • Поддерживает загрузку/выгрузку PDF-файлов через Интернет
  • Предоставление RESTful API и веб-сервисов
  • Возможность подключения к внешним системам (Curator, Cursor и т.д.) по протоколу MCP

Его можно легко интегрировать с внешними системами через RESTful API и веб-интерфейс, а также легко развертывать и эксплуатировать как в Docker, так и в локальных средах. Подходит для автоматизированного управления и поиска различных PDF-документов, таких как технические паспорта, статьи и контракты.

Основные характеристики

  • Извлечение текста из локальных PDF-файлов и PDF-файлов, доступных по URL-адресу
  • Предоставляет список PDF-файлов в /app/datasheets
  • Предоставляет функцию поиска PDF-файлов по имени файла
  • Надежное извлечение текста и обработка исключений на основе PyPDF2
  • Предоставление стандартизированных инструментов MCP на основе FastMCP

Работа с Docker

  1. Создать изображение
    docker build -t mcp-pdf-server:1.0.0 .
  2. Запуск контейнера
    docker run -d \ -v /호스트/경로/데이터:/app/datasheets \ -p 5050:5050 \ -p 5080:5080 \ --name mcp-pdf-server \ mcp-pdf-server:1.0.0
    • Если вы поместите PDF-файл в /호스트/경로/데이터 вы сможете получить к нему доступ из /app/datasheets внутри контейнера.
    • Используются порты 5050 и 5080.
  3. При использовании docker-compose
    # docker-compose.yml의 /path/to/your/datasheets를 실제 PDF 폴더 경로로 수정하세요. docker-compose up -d --build

Запуск непосредственно локально (Python)

  1. Установка зависимостей
    pip install -r requirements.txt
  2. Запуск сервера
    python mcp_server/mcp_pdf_server.py # 또는 uvicorn manager_server.main:app --host 0.0.0.0 --port 5080

Описание инструмента MCP (API)

  • read_local_pdf
    Извлеките текст, указав путь к локальному PDF-файлу.
  • read_url_pdf
    Введите URL-адрес PDF-файла и извлеките из него текст.
  • список_pdf_серверов
    Возвращает список всех PDF-файлов в каталоге /app/datasheets .
  • сервер_pdf_поиск
    Введите имя файла, найдите PDF-файл на сервере и извлеките текст из этого PDF-файла.

Руководство по маршруту

  • Данные PDF должны быть расположены по пути /app/datasheets (внутри контейнера Docker).
  • При использовании Docker смонтируйте папку PDF хоста в /app/datasheets .
  • Исходный код находится в /app/mcp_server (внутри контейнера).

Лицензия

Лицензия Apache 2.0
Автор: Dev91

-
security - not tested
A
license - permissive license
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Сервер на основе протокола контекста модели (MCP), который эффективно управляет файлами PDF, позволяя инструментам кодирования ИИ, таким как Cursor, считывать, обобщать и извлекать информацию из таблиц данных PDF для содействия разработке встроенных систем.

  1. Основные характеристики
    1. Работа с Docker
      1. Запуск непосредственно локально (Python)
        1. Описание инструмента MCP (API)
          1. Руководство по маршруту
            1. Лицензия

              Related MCP Servers

              • A
                security
                F
                license
                A
                quality
                A Model Context Protocol server that converts PDF documents into PNG images through a simple MCP tool call.
                Last updated -
                1
                2
                Python
                • Apple
                • Linux
              • -
                security
                F
                license
                -
                quality
                Implements the Model Context Protocol (MCP) to provide AI models with a standardized interface for connecting to external data sources and tools like file systems, databases, or APIs.
                Last updated -
                90
                Python
                • Apple
                • Linux
              • -
                security
                A
                license
                -
                quality
                A Model Context Protocol (MCP) server that allows AI models to safely access and interact with local file systems, enabling reading file contents, listing directories, and retrieving file metadata.
                Last updated -
                47
                1
                JavaScript
                MIT License
                • Linux
              • -
                security
                -
                license
                -
                quality
                A Model Context Protocol (MCP) server that allows interaction with PDF and EPUB documents, designed to work with Windsurf IDE by Codeium.
                Last updated -
                3
                Python
                MIT License

              View all related MCP servers

              ID: szpn5w5z6a