How do I use devitway-rag-starter?

1. Click on "Install Server". 2. Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state. 3. In the chat, type @ followed by the MCP server name and your instructions, e.g., "@devitway-rag-starter search for connecting agents" That's it! The server will respond to your query, and you can continue using it as needed. Here is a step-by-step guide with screenshots.

devitway-rag-starter

Official

by devitway

Overview Schema Related Servers Score Discussions

Python

Local

devitway-rag-starter

Минимальный, но полный E2E-стек локального RAG: документы → векторы → поиск, подключаемый к любому агенту через MCP. RAG здесь — самостоятельный слой, а не часть конкретного агента: один и тот же сервер цепляется и к qwen-code, и к Claude Code без переделок.

OFFLINE  (cron / watch — «обновляется само»):
  docs/ ─► Reader ─► Splitter ─► ollama(bge-m3) ─► Qdrant
            │           │             ▲                ▲
            └── docstore (хэш по doc_id) ─┘  не менялся→skip,
                                             изменился→upsert, удалён→delete

QUERY  (runtime, любой агент):
  agent ─MCP─► search(q) ─► ollama(bge-m3) ─► Qdrant top-k ─► фрагменты ─► agent

Роли: ollama крутит только эмбеддинг-модель (векторизация, локально) · Qdrant хранит и ищет векторы · MCP-сервер — единая точка входа для агентов. Генерацию ответа делает сам агент своей моделью (Qwen / Claude).

Требования

Docker (для Qdrant)
Python 3.10+
ollama установлена и запущена

Related MCP server: MCP Local Context

Быстрый старт

# 1. Поднять Qdrant
docker compose up -d

# 2. Скачать эмбеддинг-модель (мультиязычная, RU/EN/код)
ollama pull bge-m3

# 3. Python-окружение
python -m venv .venv
source .venv/bin/activate            # Windows: .venv\Scripts\activate
pip install -r requirements.txt

# 4. Проиндексировать документы (в ./docs уже лежит пример)
python ingest.py ./docs

# 5. Проверить, что сервер поднимается (Ctrl+C для выхода)
python mcp_server.py

Готово — RAG работает. Осталось подключить агента (ниже).

Как работает инкрементальное обновление

ingest.py хранит состояние в pipeline_storage/ (какие файлы уже проиндексированы + их хэши). При повторном запуске:

Что случилось с файлом	Действие
не менялся	пропуск (по хэшу)
изменился	переэмбеддится и upsert в Qdrant
удалён из `./docs`	его чанки удаляются из Qdrant

Полного реиндекса нет — только дельта. Поэтому запускать можно хоть каждую минуту.

Повесить на автообновление

Cron (каждые 15 минут):

*/15 * * * * cd /path/to/devitway-rag-starter && .venv/bin/python ingest.py ./docs >> ingest.log 2>&1

Watch (реагировать на изменения сразу, нужен inotify-tools):

while inotifywait -r -e modify,create,delete ./docs; do
  .venv/bin/python ingest.py ./docs
done

Подключение агентов

Оба агента цепляются к одному и тому же серверу. Обкатай на том, что уже работает, потом добавь второй — переделывать нечего.

⚠️ В command указывай абсолютный путь к python из .venv — агент запускает сервер без активации окружения, иначе не найдутся зависимости.

qwen-code

В settings.json (обычно ~/.qwen/settings.json или .qwen/settings.json в проекте):

{
  "mcpServers": {
    "rag": {
      "command": "/path/to/devitway-rag-starter/.venv/bin/python",
      "args": ["/path/to/devitway-rag-starter/mcp_server.py"]
    }
  }
}

Claude Code

claude mcp add rag -- /path/to/devitway-rag-starter/.venv/bin/python /path/to/devitway-rag-starter/mcp_server.py

Проверка: спроси агента что-нибудь по содержимому ./docs — он должен вызвать инструмент search.

Главный инвариант (не нарушай)

Индексация и поиск обязаны идти одной эмбеддинг-моделью. Проиндексируешь одной (1024d), поищешь другой (например 384d) — получишь мусор или ошибку размерности. Поэтому модель и адреса заданы в одном месте — config.py, — откуда их берут оба скрипта. Меняешь модель — меняешь в config.py и делаешь полный реиндекс (удали pipeline_storage/ и коллекцию в Qdrant).

Траблшутинг

Симптом	Причина / решение
Ошибка про `OpenAI API key`	LlamaIndex по умолчанию берёт OpenAI-эмбеддер. В этом репо `Settings.embed_model` задан явно — проверь, что не переопределил.
Поиск возвращает мусор / пусто	Модель при индексации ≠ при поиске. Держи одну (см. инвариант выше).
`Connection refused` к Qdrant	Не поднят `docker compose up -d` или занят порт 6333.
`model not found`	Забыл `ollama pull bge-m3`.
Агент не видит MCP-сервер	`command` должен указывать на `.venv/bin/python` (абсолютный путь), не на системный python.
Сервер подключён, но агент не вызывает `search` (даже по явной просьбе)	Обычно виновата локальная модель, а не RAG. Qwen3 через ollama не отдаёт tool_call в стриминге (ollama#14601) — приходит пустой ответ, и промптом это не лечится. Проверь слой отдельно: `python -c "from mcp_server import search; print(search('ollama'))"` — если фрагменты вернулись, меняй модель: `ollama pull gpt-oss:20b` (tool calling стабилен) или облачная (в qwen-code — дефолтный Qwen OAuth). Для qwen-code нужна версия ≥0.18.4 — старые флапают тул-коллинг с любой локальной моделью.

Структура

devitway-rag-starter/
├── docker-compose.yml   # Qdrant
├── requirements.txt
├── config.py            # единая конфигурация (embed-модель, адреса) — источник инварианта
├── ingest.py            # инкрементальный ингест docs -> Qdrant
├── mcp_server.py        # read-only MCP: инструмент search()
├── env.example          # cp env.example .env
└── docs/                # сюда кладёшь свои документы
    └── example.md

Куда расти

Reranker вторым этапом (bge-reranker-v2-m3) — заметно поднимает точность.
Redis-docstore вместо файлового — для большого корпуса и параллельного ингеста.
Больше форматов — SimpleDirectoryReader уже читает pdf/docx/md/txt; коннекторы (Google Drive, Notion, БД) — отдельные пакеты llama-index-readers-*.

This server cannot be installed

license - not found

quality - not tested

maintenance

How are these scores calculated?

Maintenance

–Maintainers

–Response time

–Release cycle

–Releases (12mo)

Commit activity

Resources

GitHub Repository

Need Help?

Related Servers

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

Your AI Chatbot Just Exposed Your CEO's Salary to an Intern
By Om-Shree-0709 on July 2, 2026.
Agent Identity
MCP Security
OAuth Delegation
Why MCP Servers Need Execution Sandboxing (And Why Your Current Stack Isn't Enough)
By Om-Shree-0709 on June 30, 2026.
Agentic Ai
Prompt Injection
WebAssembly
Lightport: Open-Sourcing Glama's AI Gateway
By punkpeye on April 27, 2026.
OpenAI
open source

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/devitway/devitway-rag-starter'

If you have feedback or need assistance with the MCP directory API, please join our Discord server