Multi-Agent RAG MCP Server

Overview Schema Related Servers Score Discussions

rag-mcp-server
src
data_sources

vector_store.py•5.09 KiB

from supabase import create_client, Client from sentence_transformers import SentenceTransformer from typing import List, Dict, Optional import numpy as np import os class VectorStore: """Handles vector embeddings and similarity search using Supabase + pgvector""" def __init__(self, supabase_url: str = None, supabase_key: str = None): # Get credentials from environment or parameters self.supabase_url = supabase_url or os.getenv('SUPABASE_URL') self.supabase_key = supabase_key or os.getenv('SUPABASE_KEY') if not self.supabase_url or not self.supabase_key: raise ValueError( "Supabase credentials not found. Set SUPABASE_URL and SUPABASE_KEY " "environment variables or pass them to VectorStore constructor." ) # Initialize Supabase client print("Connecting to Supabase...") self.client: Client = create_client(self.supabase_url, self.supabase_key) print("✓ Connected to Supabase") # Load the embedding model (converts text to 384-dimensional vectors) print("Loading embedding model (this may take a minute)...") self.embedding_model = SentenceTransformer('all-MiniLM-L6-v2') print("✓ Embedding model loaded") async def add_documents( self, texts: List[str], metadata: Optional[List[Dict]] = None ) -> int: """Add documents to the Supabase vector store""" if not texts: return 0 print(f"Generating embeddings for {len(texts)} text chunks...") # Generate embeddings (convert text to vectors) embeddings = self.embedding_model.encode(texts, show_progress_bar=True) # Prepare data for insertion documents_to_insert = [] for i, (text, embedding) in enumerate(zip(texts, embeddings)): doc = { 'content': text, 'embedding': embedding.tolist(), # Convert numpy array to list 'metadata': metadata[i] if metadata and i < len(metadata) else {} } documents_to_insert.append(doc) # Insert into Supabase (in batches of 100 to avoid timeouts) batch_size = 100 total_inserted = 0 for i in range(0, len(documents_to_insert), batch_size): batch = documents_to_insert[i:i + batch_size] try: response = self.client.table('vector_documents').insert(batch).execute() total_inserted += len(batch) print(f" Inserted batch: {total_inserted}/{len(documents_to_insert)}") except Exception as e: print(f" Error inserting batch: {e}") raise print(f"✓ Successfully inserted {total_inserted} documents") return total_inserted async def search( self, query: str, n_results: int = 5, similarity_threshold: float = 0.1 ) -> List[Dict]: """Search for similar documents using semantic similarity""" print(f"Searching for: '{query}'") # Convert query to vector query_embedding = self.embedding_model.encode([query])[0] # Call the Supabase function for similarity search try: response = self.client.rpc( 'match_documents', { 'query_embedding': query_embedding.tolist(), 'match_threshold': similarity_threshold, 'match_count': n_results } ).execute() results = response.data # Format results formatted_results = [] for result in results: formatted_results.append({ 'id': result['id'], 'document': result['content'], 'metadata': result['metadata'], 'similarity': result['similarity'] }) print(f"✓ Found {len(formatted_results)} results") return formatted_results except Exception as e: print(f"✗ Error during search: {e}") raise async def get_document_count(self) -> int: """Get total number of documents in the database""" try: response = self.client.table('vector_documents').select('id', count='exact').execute() return response.count except Exception as e: print(f"Error getting document count: {e}") return 0 async def clear_all_documents(self) -> int: """Delete all documents from the database (use with caution!)""" try: response = self.client.table('vector_documents').delete().neq('id', 0).execute() deleted = len(response.data) if response.data else 0 print(f"✓ Cleared {deleted} documents from database") return deleted except Exception as e: print(f"✗ Error clearing documents: {e}") raise

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/Tsarri/rag-mcp-server'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

vector_store.py•5.09 KiB