DuckDB-RAG-MCP-Sample

by nananaman
Verified

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Uses DuckDB for vector search capabilities to enable retrieval augmented generation (RAG) from markdown documents

  • Processes markdown files by extracting text and converting it to vector embeddings for semantic search

Ejemplo de MCP RAG de DuckDB

Este es un ejemplo que integra y vectoriza un documento Markdown para que pueda explicarse utilizando MCP y RAG.

Utilizamos Plamo-Embedding-1B para la vectorización.

función

  • Extraer y vectorizar texto de archivos Markdown
  • Búsqueda de vectores con DuckDB
  • Persistencia de datos vectoriales con archivos Parquet
  • Búsqueda de vectores desde MCP

Cómo utilizar

Generación de datos vectoriales

Primero, coloque los archivos markdown que desea buscar en un directorio específico, luego conviértalos en archivos Parquet con el siguiente comando.

uv run main.py --directory ~/path/to/markdown/files --parquet vectors.parquet

Configuración de MCP

Construir

El siguiente comando generará un único binario en dist/server .

uv run pyinstaller --clean --strip --noconfirm --onefile server.py

Configuración del cliente MCP

Configúrelo según el cliente que desee utilizar.

Para Claude Desktop se ve así:

Para VECTOR_PARQUET, especifique el archivo que acaba de convertir.

uv run mcp install server.py -v VECTOR_PARQUET=/path/to/vectors.parquet

Se establece de la siguiente manera:

{ "mcpServers": { "DuckDB-RAG-MCP-Sample": { "command": "/path/to/dist/server", "env": { "VECTOR_PARQUET": "/path/to/vectors.parquet" } } } }

Iniciar el servidor de desarrollo

uv run mcp dev server.py

licencia

El ejemplo DuckDB RAG MCP se proporciona bajo la licencia Apache, versión 2.0.

-
security - not tested
A
license - permissive license
-
quality - not tested

Un servidor MCP que habilita RAG (Recuperación-Generación Aumentada) en documentos Markdown convirtiéndolos en vectores de incrustación y realizando una búsqueda de vectores utilizando DuckDB.

  1. 機能
    1. 使用方法
      1. ベクトルデータ生成
      2. MCP の設定
      3. 開発用サーバー起動
    2. ライセンス
      ID: 1qfkx3fdax