DuckDB-RAG-MCP-Sample

by nananaman
Verified

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Uses DuckDB for vector search capabilities to enable retrieval augmented generation (RAG) from markdown documents

  • Processes markdown files by extracting text and converting it to vector embeddings for semantic search

DuckDB RAG MCP Sample

markdown 문서를 포함 벡터화하여 MCP에서 RAG로 설명할 수 있는 샘플입니다.

벡터화에는 Plamo-Embedding-1B 를 사용합니다.

기능

  • markdown 파일에서 텍스트 추출 및 벡터화
  • DuckDB를 사용하여 벡터 검색
  • Parquet 파일로 벡터 데이터 지속성
  • MCP에서 벡터 검색

사용방법

벡터 데이터 생성

먼저 검색할 markdown 파일을 특정 디렉토리에 넣고 다음 명령을 사용하여 Parquet 파일로 변환하십시오.

uv run main.py --directory ~/path/to/markdown/files --parquet vectors.parquet

MCP 설정

빌드

다음 명령은 단일 바이너리를 dist/server 로 생성합니다.

uv run pyinstaller --clean --strip --noconfirm --onefile server.py

MCP 클라이언트 설정

사용하려는 클라이언트에 따라 설정하십시오.

Claude Desktop의 경우는 다음과 같은 느낌입니다.

VECTOR_PARQUET는 이전에 변환된 파일을 지정해야 합니다.

uv run mcp install server.py -v VECTOR_PARQUET=/path/to/vectors.parquet

다음과 같이 설정됩니다.

{ "mcpServers": { "DuckDB-RAG-MCP-Sample": { "command": "/path/to/dist/server", "env": { "VECTOR_PARQUET": "/path/to/vectors.parquet" } } } }

개발 서버 시작

uv run mcp dev server.py

라이센스

DuckDB RAG MCP Sample은 Apache License, Version 2.0에서 제공됩니다.

-
security - not tested
A
license - permissive license
-
quality - not tested

An MCP server that enables RAG (Retrieval-Augmented Generation) on markdown documents by converting them to embedding vectors and performing vector search using DuckDB.

  1. 機能
    1. 使用方法
      1. ベクトルデータ生成
      2. MCP の設定
      3. 開発用サーバー起動
    2. ライセンス
      ID: 1qfkx3fdax