devitway-rag-starter
OfficialClick on "Install Server".
Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state.
In the chat, type
@followed by the MCP server name and your instructions, e.g., "@devitway-rag-startersearch for connecting agents"
That's it! The server will respond to your query, and you can continue using it as needed.
Here is a step-by-step guide with screenshots.
devitway-rag-starter
Минимальный, но полный E2E-стек локального RAG: документы → векторы → поиск,
подключаемый к любому агенту через MCP. RAG здесь — самостоятельный слой,
а не часть конкретного агента: один и тот же сервер цепляется и к qwen-code,
и к Claude Code без переделок.
OFFLINE (cron / watch — «обновляется само»):
docs/ ─► Reader ─► Splitter ─► ollama(bge-m3) ─► Qdrant
│ │ ▲ ▲
└── docstore (хэш по doc_id) ─┘ не менялся→skip,
изменился→upsert, удалён→delete
QUERY (runtime, любой агент):
agent ─MCP─► search(q) ─► ollama(bge-m3) ─► Qdrant top-k ─► фрагменты ─► agentРоли: ollama крутит только эмбеддинг-модель (векторизация, локально) ·
Qdrant хранит и ищет векторы · MCP-сервер — единая точка входа для агентов.
Генерацию ответа делает сам агент своей моделью (Qwen / Claude).
Требования
Docker (для Qdrant)
Python 3.10+
ollama установлена и запущена
Related MCP server: MCP Local Context
Быстрый старт
# 1. Поднять Qdrant
docker compose up -d
# 2. Скачать эмбеддинг-модель (мультиязычная, RU/EN/код)
ollama pull bge-m3
# 3. Python-окружение
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install -r requirements.txt
# 4. Проиндексировать документы (в ./docs уже лежит пример)
python ingest.py ./docs
# 5. Проверить, что сервер поднимается (Ctrl+C для выхода)
python mcp_server.pyГотово — RAG работает. Осталось подключить агента (ниже).
Как работает инкрементальное обновление
ingest.py хранит состояние в pipeline_storage/ (какие файлы уже
проиндексированы + их хэши). При повторном запуске:
Что случилось с файлом | Действие |
не менялся | пропуск (по хэшу) |
изменился | переэмбеддится и upsert в Qdrant |
удалён из | его чанки удаляются из Qdrant |
Полного реиндекса нет — только дельта. Поэтому запускать можно хоть каждую минуту.
Повесить на автообновление
Cron (каждые 15 минут):
*/15 * * * * cd /path/to/devitway-rag-starter && .venv/bin/python ingest.py ./docs >> ingest.log 2>&1Watch (реагировать на изменения сразу, нужен inotify-tools):
while inotifywait -r -e modify,create,delete ./docs; do
.venv/bin/python ingest.py ./docs
doneПодключение агентов
Оба агента цепляются к одному и тому же серверу. Обкатай на том, что уже работает, потом добавь второй — переделывать нечего.
⚠️ В
commandуказывай абсолютный путь к python из .venv — агент запускает сервер без активации окружения, иначе не найдутся зависимости.
qwen-code
В settings.json (обычно ~/.qwen/settings.json или .qwen/settings.json в проекте):
{
"mcpServers": {
"rag": {
"command": "/path/to/devitway-rag-starter/.venv/bin/python",
"args": ["/path/to/devitway-rag-starter/mcp_server.py"]
}
}
}Claude Code
claude mcp add rag -- /path/to/devitway-rag-starter/.venv/bin/python /path/to/devitway-rag-starter/mcp_server.pyПроверка: спроси агента что-нибудь по содержимому ./docs — он должен вызвать
инструмент search.
Главный инвариант (не нарушай)
Индексация и поиск обязаны идти одной эмбеддинг-моделью. Проиндексируешь одной
(1024d), поищешь другой (например 384d) — получишь мусор или ошибку размерности.
Поэтому модель и адреса заданы в одном месте — config.py, — откуда их берут оба
скрипта. Меняешь модель — меняешь в config.py и делаешь полный реиндекс
(удали pipeline_storage/ и коллекцию в Qdrant).
Траблшутинг
Симптом | Причина / решение |
Ошибка про | LlamaIndex по умолчанию берёт OpenAI-эмбеддер. В этом репо |
Поиск возвращает мусор / пусто | Модель при индексации ≠ при поиске. Держи одну (см. инвариант выше). |
| Не поднят |
| Забыл |
Агент не видит MCP-сервер |
|
Структура
devitway-rag-starter/
├── docker-compose.yml # Qdrant
├── requirements.txt
├── config.py # единая конфигурация (embed-модель, адреса) — источник инварианта
├── ingest.py # инкрементальный ингест docs -> Qdrant
├── mcp_server.py # read-only MCP: инструмент search()
├── env.example # cp env.example .env
└── docs/ # сюда кладёшь свои документы
└── example.mdКуда расти
Reranker вторым этапом (
bge-reranker-v2-m3) — заметно поднимает точность.Redis-docstore вместо файлового — для большого корпуса и параллельного ингеста.
Больше форматов —
SimpleDirectoryReaderуже читает pdf/docx/md/txt; коннекторы (Google Drive, Notion, БД) — отдельные пакетыllama-index-readers-*.
This server cannot be installed
Maintenance
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
- Your AI Chatbot Just Exposed Your CEO's Salary to an InternBy Om-Shree-0709 on .Agent IdentityMCP SecurityOAuth Delegation
- Why MCP Servers Need Execution Sandboxing (And Why Your Current Stack Isn't Enough)By Om-Shree-0709 on .Agentic AiPrompt InjectionWebAssembly
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/devitway/devitway-rag-starter'
If you have feedback or need assistance with the MCP directory API, please join our Discord server