Integrations
Powers the modern web interface with a React-based UI component library for document management and querying
Provides the backend framework that handles API requests, PDF processing, and vector storage operations
Supports version control for the project installation process
PDF RAG MCP-сервер
Мощная система базы знаний документов, которая использует обработку PDF, векторное хранилище и MCP (Model Context Protocol) для предоставления возможностей семантического поиска для документов PDF. Эта система позволяет загружать, обрабатывать и запрашивать документы PDF через современный веб-интерфейс или через протокол MCP для интеграции с инструментами ИИ, такими как Cursor.
Функции
- Загрузка и обработка PDF-документов : загрузка PDF-файлов и автоматическое извлечение, разбиение на части и векторизация контента.
- Статус обработки в реальном времени : обновление статуса в реальном времени на основе WebSocket во время обработки документа.
- Семантический поиск : векторный семантический поиск по всем обработанным документам.
- Поддержка протокола MCP : интеграция с инструментами ИИ, такими как Cursor, с использованием протокола контекста модели
- Современный веб-интерфейс : интерфейс React/Chakra UI для управления документами и создания запросов
- Быстрое управление зависимостями : использует uv для эффективного управления зависимостями Python
Архитектура системы
Система состоит из:
- FastAPI Backend : обрабатывает запросы API, обрабатывает PDF-файлы и хранит векторные данные.
- React Frontend : предоставляет удобный интерфейс для управления документами.
- Векторная база данных : хранит вложения для семантического поиска
- Сервер WebSocket : предоставляет обновления в режиме реального времени по обработке документов.
- MCP Server : предоставляет базу знаний клиентам, совместимым с MCP.
Быстрый старт
Предпосылки
- Python 3.8 или более поздняя версия
- uv - Быстрый установщик и распознаватель пакетов Python
- Гит
- Курсор (опционально, для интеграции MCP)
Быстрая установка и запуск с помощью uv и run.py
- Клонируйте репозиторий:Copy
- Установите uv, если у вас его еще нет:Copy
- Установите зависимости с помощью uv:Copy
- Запустите приложение с помощью удобного скрипта:Copy
- Доступ к веб-интерфейсу по адресу http://localhost:8000
- Использование с курсором
Перейдите в Настройки -> Настройки курсора -> MCP -> Добавить новый глобальный сервер MCP, вставьте ниже в файл Cursor ~/.cursor/mcp.json. Для получения дополнительной информации см. документацию Cursor MCP.
Вы также можете изменить localhost на IP-адрес хоста, на котором вы развернули службу. После добавления этой конфигурации в mcp json вы увидите, что сервер mcp отображается на странице конфигурации Cursor mcp, включите его, чтобы включить сервер:
Создание фронтенда (для разработчиков)
Если вам необходимо перестроить интерфейс, у вас есть два варианта:
Вариант 1: использование предоставленного скрипта (рекомендуется)
Этот скрипт автоматически:
- Установка зависимостей интерфейса
- Создание интерфейса
- Скопируйте вывод сборки в статический каталог бэкэнда.
Вариант 2: Ручной процесс сборки
После создания интерфейса вы можете запустить приложение с помощью скрипта run.py.
Простая настройка производства
Для производственной среды, где статические файлы уже созданы:
- Поместите готовый фронтенд в каталог
backend/static
- Запустите сервер:Copy
Настройка разработки (отдельные службы)
Если вы хотите запустить службы отдельно для разработки:
Бэкэнд
- Перейдите в каталог бэкэнда:Copy
- Установите зависимости с помощью uv:Copy
- Запустите внутренний сервер:Copy
Внешний интерфейс
- Перейдите в каталог интерфейса:Copy
- Установите зависимости:Copy
- Запустите сервер разработки:Copy
Использование
Загрузка документов
- Доступ к веб-интерфейсу по адресу http://localhost:8000
- Нажмите «Загрузить новый PDF» и выберите PDF-файл.
- Система обработает файл, показывая прогресс в режиме реального времени.
- После обработки документ будет доступен для поиска.
Поиск документов
- Используйте функцию поиска в веб-интерфейсе
- Или интегрируйте с Cursor, используя протокол MCP
Интеграция MCP с курсором
- Открытый курсор
- Перейдите в Настройки → ИИ и MCP.
- Добавьте пользовательский сервер MCP с URL-адресом:
http://localhost:8000/mcp/v1
- Сохраните настройки
- Теперь вы можете запрашивать информацию из базы знаний PDF-файлов непосредственно из Курсора
Поиск неисправностей
Проблемы с подключением
- Убедитесь, что порт 8000 не используется другими приложениями.
- Проверьте правильность работы соединения WebSocket.
- Убедитесь, что ваш браузер поддерживает WebSockets
Проблемы с обработкой
- Проверьте, содержит ли ваш PDF-файл извлекаемый текст (некоторые отсканированные PDF-файлы могут не содержать извлекаемый текст)
- Убедитесь, что система имеет достаточные ресурсы (память и процессор)
- Проверьте внутренние журналы на наличие подробных сообщений об ошибках.
Структура проекта
Внося вклад
Вклады приветствуются! Пожалуйста, не стесняйтесь отправлять запрос на включение.
Лицензия
Данный проект лицензирован по лицензии MIT — подробности см. в файле LICENSE.
This server cannot be installed
Система базы знаний документов, которая позволяет пользователям загружать PDF-файлы и выполнять семантические запросы к ним через веб-интерфейс или через протокол контекста модели, обеспечивая интеграцию с инструментами ИИ, такими как Cursor.
Related MCP Servers
- AsecurityFlicenseAqualityA Model Context Protocol server that enables AI models to interact with SourceSync.ai's knowledge management platform for managing documents, ingesting content from various sources, and performing semantic searches.Last updated -2514
- AsecurityAlicenseAqualityA Model Context Protocol implementation that enables AI assistants to interact with markdown documentation files, providing capabilities for document management, metadata handling, search, and documentation health analysis.Last updated -1434611TypeScriptMIT License
- AsecurityAlicenseAqualityA powerful Model Context Protocol framework that extends Cursor IDE with tools for web content retrieval, PDF processing, and Word document parsing.Last updated -88PythonMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI assistants to create, read, edit, and format Microsoft Word documents through standardized tools and resources.Last updated -1688PythonMIT License