MCP Server for Milvus

Overview Schema Related Servers Score Discussions

mcp-server-milvus
src
mcp_server_milvus

server.py•30.6 KiB

import argparse import os from contextlib import asynccontextmanager from typing import Any, AsyncIterator, Optional, List from dotenv import load_dotenv import json from fastmcp import FastMCP, Context from pymilvus import ( MilvusClient, DataType, AnnSearchRequest, RRFRanker, ) class MilvusConnector: def __init__( self, uri: str, token: Optional[str] = None, db_name: Optional[str] = "default" ): self.uri = uri self.token = token self.client = MilvusClient(uri=uri, token=token, db_name=db_name) async def list_collections(self) -> list[str]: """List all collections in the database.""" try: return self.client.list_collections() except Exception as e: raise ValueError(f"Failed to list collections: {str(e)}") async def get_collection_info(self, collection_name: str) -> dict: """Get detailed information about a collection.""" try: return self.client.describe_collection(collection_name) except Exception as e: raise ValueError(f"Failed to get collection info: {str(e)}") async def search_collection( self, collection_name: str, query_text: str, limit: int = 5, output_fields: Optional[list[str]] = None, drop_ratio: float = 0.2, ) -> list[dict]: """ Perform full text search on a collection. Args: collection_name: Name of collection to search query_text: Text to search for limit: Maximum number of results output_fields: Fields to return in results drop_ratio: Proportion of low-frequency terms to ignore (0.0-1.0) """ try: search_params = {"params": {"drop_ratio_search": drop_ratio}} results = self.client.search( collection_name=collection_name, data=[query_text], anns_field="sparse", limit=limit, output_fields=output_fields, search_params=search_params, ) return results except Exception as e: raise ValueError(f"Search failed: {str(e)}") async def query_collection( self, collection_name: str, filter_expr: str, output_fields: Optional[list[str]] = None, limit: int = 10, ) -> list[dict]: """Query collection using filter expressions.""" try: return self.client.query( collection_name=collection_name, filter=filter_expr, output_fields=output_fields, limit=limit, ) except Exception as e: raise ValueError(f"Query failed: {str(e)}") async def vector_search( self, collection_name: str, vector: list[float], vector_field: str, limit: int = 5, output_fields: Optional[list[str]] = None, metric_type: str = "COSINE", filter_expr: Optional[str] = None, ) -> list[dict]: """ Perform vector similarity search on a collection. Args: collection_name: Name of collection to search vector: Query vector vector_field: Field containing vectors to search limit: Maximum number of results output_fields: Fields to return in results metric_type: Distance metric (COSINE, L2, IP) filter_expr: Optional filter expression """ try: search_params = {"metric_type": metric_type, "params": {"nprobe": 10}} results = self.client.search( collection_name=collection_name, data=[vector], anns_field=vector_field, search_params=search_params, limit=limit, output_fields=output_fields, filter=filter_expr, ) return results except Exception as e: raise ValueError(f"Vector search failed: {str(e)}") async def text_similarity_search( self, collection_name: str, query_text: str, anns_field: str, limit: int = 5, output_fields: Optional[list[str]] = None, metric_type: str = "COSINE", filter_expr: Optional[str] = None, ) -> list[dict]: """ Perform text similarity search on a collection. Args: collection_name: Name of collection to search query_text: Text query for similarity search anns_field: Field name for text search limit: Maximum number of results output_fields: Fields to return in results metric_type: Distance metric (COSINE, L2, IP) filter_expr: Optional filter expression """ try: search_params = {"metric_type": metric_type, "params": {"nprobe": 10}} results = self.client.search( collection_name=collection_name, data=[query_text], anns_field=anns_field, search_params=search_params, limit=limit, output_fields=output_fields, filter=filter_expr, ) return results except Exception as e: raise ValueError(f"Text similarity search failed: {str(e)}") async def hybrid_search( self, collection_name: str, query_text: str, text_field: str, vector: List[float], vector_field: str, limit: int, output_fields: Optional[list[str]] = None, filter_expr: Optional[str] = None, ) -> list[dict]: """ Perform hybrid search combining BM25 text search and vector search with RRF ranking. Args: collection_name: Name of collection to search query_text: Text query for BM25 search text_field: Field name for text search vector: Query vector for dense vector search vector_field: Field name for vector search limit: Maximum number of results output_fields: Fields to return in results filter_expr: Optional filter expression """ try: sparse_params = {"params": {"nprobe": 10}} dense_params = {"params": {"drop_ratio_build": 0.2}} # BM25 search request sparse_request = AnnSearchRequest( data=[query_text], anns_field=text_field, param=sparse_params, limit=limit, ) # dense vector search request dense_request = AnnSearchRequest( data=[vector], anns_field=vector_field, param=dense_params, limit=limit, ) # hybrid search results = self.client.hybrid_search( collection_name=collection_name, reqs=[sparse_request, dense_request], ranker=RRFRanker(60), limit=limit, output_fields=output_fields, filter=filter_expr, ) return results except Exception as e: raise ValueError(f"Hybrid search failed: {str(e)}") async def create_collection( self, collection_name: str, schema: dict[str, Any], index_params: Optional[dict[str, Any]] = None, ) -> bool: """ Create a new collection with the specified schema. Args: collection_name: Name for the new collection schema: Collection schema definition index_params: Optional index parameters """ try: # Check if collection already exists if collection_name in self.client.list_collections(): raise ValueError(f"Collection '{collection_name}' already exists") # Create collection self.client.create_collection( collection_name=collection_name, dimension=schema.get("dimension", 128), primary_field=schema.get("primary_field", "id"), id_type=schema.get("id_type", DataType.INT64), vector_field=schema.get("vector_field", "vector"), metric_type=schema.get("metric_type", "COSINE"), auto_id=schema.get("auto_id", False), enable_dynamic_field=schema.get("enable_dynamic_field", True), other_fields=schema.get("other_fields", []), ) # Create index if params provided if index_params: self.client.create_index( collection_name=collection_name, field_name=schema.get("vector_field", "vector"), index_params=index_params, ) return True except Exception as e: raise ValueError(f"Failed to create collection: {str(e)}") async def insert_data( self, collection_name: str, data: list[dict[str, Any]] ) -> dict[str, Any]: """ Insert data into a collection. Args: collection_name: Name of collection data: List of dictionaries, each representing a record """ try: result = self.client.insert(collection_name=collection_name, data=data) return result except Exception as e: raise ValueError(f"Insert failed: {str(e)}") async def delete_entities( self, collection_name: str, filter_expr: str ) -> dict[str, Any]: """ Delete entities from a collection based on filter expression. Args: collection_name: Name of collection filter_expr: Filter expression to select entities to delete """ try: result = self.client.delete( collection_name=collection_name, expr=filter_expr ) return result except Exception as e: raise ValueError(f"Delete failed: {str(e)}") async def get_collection_stats(self, collection_name: str) -> dict[str, Any]: """ Get statistics about a collection. Args: collection_name: Name of collection """ try: return self.client.get_collection_stats(collection_name) except Exception as e: raise ValueError(f"Failed to get collection stats: {str(e)}") async def multi_vector_search( self, collection_name: str, vectors: list[list[float]], vector_field: str, limit: int = 5, output_fields: Optional[list[str]] = None, metric_type: str = "COSINE", filter_expr: Optional[str] = None, search_params: Optional[dict[str, Any]] = None, ) -> list[list[dict]]: """ Perform vector similarity search with multiple query vectors. Args: collection_name: Name of collection to search vectors: List of query vectors vector_field: Field containing vectors to search limit: Maximum number of results per query output_fields: Fields to return in results metric_type: Distance metric (COSINE, L2, IP) filter_expr: Optional filter expression search_params: Additional search parameters """ try: if search_params is None: search_params = {"metric_type": metric_type, "params": {"nprobe": 10}} results = self.client.search( collection_name=collection_name, data=vectors, anns_field=vector_field, search_params=search_params, limit=limit, output_fields=output_fields, filter=filter_expr, ) return results except Exception as e: raise ValueError(f"Multi-vector search failed: {str(e)}") async def create_index( self, collection_name: str, field_name: str, index_type: str = "IVF_FLAT", metric_type: str = "COSINE", params: Optional[dict[str, Any]] = None, ) -> bool: """ Create an index on a vector field. Args: collection_name: Name of collection field_name: Field to index index_type: Type of index (IVF_FLAT, HNSW, etc.) metric_type: Distance metric (COSINE, L2, IP) params: Additional index parameters """ try: if params is None: params = {"nlist": 1024} index_params = { "index_type": index_type, "metric_type": metric_type, "params": params, } self.client.create_index( collection_name=collection_name, field_name=field_name, index_params=index_params, ) return True except Exception as e: raise ValueError(f"Failed to create index: {str(e)}") async def bulk_insert( self, collection_name: str, data: dict[str, list[Any]], batch_size: int = 1000 ) -> list[dict[str, Any]]: """ Insert data in batches for better performance. Args: collection_name: Name of collection data: Dictionary mapping field names to lists of values batch_size: Number of records per batch """ try: results = [] field_names = list(data.keys()) total_records = len(data[field_names[0]]) for i in range(0, total_records, batch_size): batch_data = { field: data[field][i : i + batch_size] for field in field_names } result = self.client.insert( collection_name=collection_name, data=batch_data ) results.append(result) return results except Exception as e: raise ValueError(f"Bulk insert failed: {str(e)}") async def load_collection( self, collection_name: str, replica_number: int = 1 ) -> bool: """ Load a collection into memory for search and query. Args: collection_name: Name of collection to load replica_number: Number of replicas """ try: self.client.load_collection( collection_name=collection_name, replica_number=replica_number ) return True except Exception as e: raise ValueError(f"Failed to load collection: {str(e)}") async def release_collection(self, collection_name: str) -> bool: """ Release a collection from memory. Args: collection_name: Name of collection to release """ try: self.client.release_collection(collection_name=collection_name) return True except Exception as e: raise ValueError(f"Failed to release collection: {str(e)}") async def get_query_segment_info(self, collection_name: str) -> dict[str, Any]: """ Get information about query segments. Args: collection_name: Name of collection """ try: return self.client.get_query_segment_info(collection_name) except Exception as e: raise ValueError(f"Failed to get query segment info: {str(e)}") async def upsert_data( self, collection_name: str, data: dict[str, list[Any]] ) -> dict[str, Any]: """ Upsert data into a collection (insert or update if exists). Args: collection_name: Name of collection data: Dictionary mapping field names to lists of values """ try: result = self.client.upsert(collection_name=collection_name, data=data) return result except Exception as e: raise ValueError(f"Upsert failed: {str(e)}") async def get_index_info( self, collection_name: str, field_name: Optional[str] = None ) -> dict[str, Any]: """ Get information about indexes in a collection. Args: collection_name: Name of collection field_name: Optional specific field to get index info for """ try: return self.client.describe_index( collection_name=collection_name, index_name=field_name ) except Exception as e: raise ValueError(f"Failed to get index info: {str(e)}") async def get_collection_loading_progress( self, collection_name: str ) -> dict[str, Any]: """ Get the loading progress of a collection. Args: collection_name: Name of collection """ try: return self.client.get_load_state(collection_name) except Exception as e: raise ValueError(f"Failed to get loading progress: {str(e)}") async def list_databases(self) -> list[str]: """List all databases in the Milvus instance.""" try: return self.client.list_databases() except Exception as e: raise ValueError(f"Failed to list databases: {str(e)}") async def use_database(self, db_name: str) -> bool: """Switch to a different database. Args: db_name: Name of the database to use """ try: # Create a new client with the specified database self.client = MilvusClient(uri=self.uri, token=self.token, db_name=db_name) return True except Exception as e: raise ValueError(f"Failed to switch database: {str(e)}") class MilvusContext: def __init__(self, connector: MilvusConnector): self.connector = connector @asynccontextmanager async def server_lifespan(server: FastMCP) -> AsyncIterator[MilvusContext]: """Manage application lifecycle for Milvus connector.""" config = server.config connector = MilvusConnector( uri=config.get("milvus_uri", "http://localhost:19530"), token=config.get("milvus_token"), db_name=config.get("db_name", "default"), ) try: yield MilvusContext(connector) finally: pass mcp = FastMCP(name="Milvus", lifespan=server_lifespan) @mcp.tool() async def milvus_text_search( collection_name: str, query_text: str, limit: int = 5, output_fields: Optional[list[str]] = None, drop_ratio: float = 0.2, ctx: Context = None, ) -> str: """ Search for documents using full text search in a Milvus collection. Args: collection_name: Name of the collection to search query_text: Text to search for limit: Maximum number of results to return output_fields: Fields to include in results drop_ratio: Proportion of low-frequency terms to ignore (0.0-1.0) """ try: connector = ctx.request_context.lifespan_context.connector results = await connector.search_collection( collection_name=collection_name, query_text=query_text, limit=limit, output_fields=output_fields, drop_ratio=drop_ratio, ) output = ( f"Search results for '{query_text}' in collection '{collection_name}':\n\n" ) for result in results: output += f"{result}\n\n" return output except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_list_collections(ctx: Context) -> str: """List all collections in the database.""" try: connector = ctx.request_context.lifespan_context.connector collections = await connector.list_collections() return f"Collections in database:\n{', '.join(collections)}" except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_query( collection_name: str, filter_expr: str, output_fields: Optional[list[str]] = None, limit: int = 10, ctx: Context = None, ) -> str: """ Query collection using filter expressions. Args: collection_name: Name of the collection to query filter_expr: Filter expression (e.g. 'age > 20') output_fields: Fields to include in results limit: Maximum number of results """ try: connector = ctx.request_context.lifespan_context.connector results = await connector.query_collection( collection_name=collection_name, filter_expr=filter_expr, output_fields=output_fields, limit=limit, ) output = ( f"Query results for '{filter_expr}' in collection '{collection_name}':\n\n" ) for result in results: output += f"{result}\n\n" return output except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_vector_search( collection_name: str, vector: list[float], vector_field: str = "vector", limit: int = 5, output_fields: Optional[list[str]] = None, metric_type: str = "COSINE", filter_expr: Optional[str] = None, ctx: Context = None, ) -> str: """ Perform vector similarity search on a collection. Args: collection_name: Name of the collection to search vector: Query vector vector_field: Field containing vectors to search limit: Maximum number of results output_fields: Fields to include in results metric_type: Distance metric (COSINE, L2, IP) filter_expr: Optional filter expression """ try: connector = ctx.request_context.lifespan_context.connector results = await connector.vector_search( collection_name=collection_name, vector=vector, vector_field=vector_field, limit=limit, output_fields=output_fields, metric_type=metric_type, filter_expr=filter_expr, ) output = f"Vector search results for '{collection_name}':\n\n" for result in results: output += f"{result}\n\n" return output except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_hybrid_search( collection_name: str, query_text: str, text_field: str, vector: list[float], vector_field: str, limit: int = 5, output_fields: Optional[list[str]] = None, filter_expr: Optional[str] = None, ctx: Context = None, ) -> str: """ Perform hybrid search combining text and vector search. Args: collection_name: Name of collection to search query_text: Text query for BM25 search text_field: Field name for text search vector: Query vector for dense vector search vector_field: Field name for vector search limit: Maximum number of results output_fields: Fields to return in results filter_expr: Optional filter expression """ try: connector = ctx.request_context.lifespan_context.connector results = await connector.hybrid_search( collection_name=collection_name, query_text=query_text, text_field=text_field, vector=vector, vector_field=vector_field, limit=limit, output_fields=output_fields, filter_expr=filter_expr, ) output = ( f"Hybrid search results for text '{query_text}' in '{collection_name}':\n\n" ) for result in results: output += f"{result}\n\n" return output except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_text_similarity_search( collection_name: str, query_text: str, anns_field: str, limit: int = 5, output_fields: Optional[list[str]] = None, metric_type: str = "COSINE", filter_expr: Optional[str] = None, ctx: Context = None, ) -> str: """ Perform text similarity search on a collection. Args: collection_name: Name of collection to search query_text: Text query for similarity search anns_field: Field name for text search limit: Maximum number of results output_fields: Fields to include in results metric_type: Distance metric (COSINE, L2, IP) filter_expr: Optional filter expression """ try: connector = ctx.request_context.lifespan_context.connector results = await connector.text_similarity_search( collection_name=collection_name, query_text=query_text, anns_field=anns_field, limit=limit, output_fields=output_fields, metric_type=metric_type, filter_expr=filter_expr, ) output = f"Text similarity search results for '{query_text}' in '{collection_name}':\n\n" for result in results: output += f"{result}\n\n" return output except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_create_collection( collection_name: str, collection_schema: dict[str, Any], index_params: Optional[dict[str, Any]] = None, ctx: Context = None, ) -> str: """ Create a new collection with specified schema. Args: collection_name: Name for the new collection collection_schema: Collection schema definition index_params: Optional index parameters """ try: connector = ctx.request_context.lifespan_context.connector success = await connector.create_collection( collection_name=collection_name, schema=collection_schema, index_params=index_params, ) return f"Collection '{collection_name}' created successfully" except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_insert_data( collection_name: str, data: list[dict[str, Any]], ctx: Context = None ) -> str: """ Insert data into a collection. Args: collection_name: Name of collection data: List of dictionaries, each representing a record """ try: connector = ctx.request_context.lifespan_context.connector result = await connector.insert_data(collection_name=collection_name, data=data) return f"Data inserted into collection '{collection_name}' with result: {str(result)}" except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_delete_entities( collection_name: str, filter_expr: str, ctx: Context = None ) -> str: """ Delete entities from a collection based on filter expression. Args: collection_name: Name of collection filter_expr: Filter expression to select entities to delete """ try: connector = ctx.request_context.lifespan_context.connector result = await connector.delete_entities( collection_name=collection_name, filter_expr=filter_expr ) return f"Entities deleted from collection '{collection_name}' with result: {str(result)}" except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_load_collection( collection_name: str, replica_number: int = 1, ctx: Context = None ) -> str: """ Load a collection into memory for search and query. Args: collection_name: Name of collection to load replica_number: Number of replicas """ try: connector = ctx.request_context.lifespan_context.connector success = await connector.load_collection( collection_name=collection_name, replica_number=replica_number ) return f"Collection '{collection_name}' loaded successfully with {replica_number} replica(s)" except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_release_collection(collection_name: str, ctx: Context = None) -> str: """ Release a collection from memory. Args: collection_name: Name of collection to release """ try: connector = ctx.request_context.lifespan_context.connector success = await connector.release_collection(collection_name=collection_name) return f"Collection '{collection_name}' released successfully" except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_list_databases(ctx: Context = None) -> str: """List all databases in the Milvus instance.""" try: connector = ctx.request_context.lifespan_context.connector databases = await connector.list_databases() return f"Databases in Milvus instance:\n{', '.join(databases)}" except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_use_database(db_name: str, ctx: Context = None) -> str: """ Switch to a different database. Args: db_name: Name of the database to use """ try: connector = ctx.request_context.lifespan_context.connector success = await connector.use_database(db_name) return f"Switched to database '{db_name}' successfully" except Exception as e: return f"Error: {str(e)}" @mcp.tool() async def milvus_get_collection_info(collection_name: str, ctx: Context = None) -> str: """ Lists detailed information about a specific collection Args: collection_name: Name of collection to load """ try: connector = ctx.request_context.lifespan_context.connector collection_info = await connector.get_collection_info(collection_name) info_str = json.dumps(collection_info, indent=2, default=list) return f"Collection information:\n{info_str}" except Exception as e: return f"Error: {str(e)}" def parse_arguments(): parser = argparse.ArgumentParser(description="Milvus MCP Server") parser.add_argument( "--milvus-uri", type=str, default="http://localhost:19530", help="Milvus server URI", ) parser.add_argument( "--milvus-token", type=str, default=None, help="Milvus authentication token" ) parser.add_argument( "--milvus-db", type=str, default="default", help="Milvus database name" ) parser.add_argument("--sse", action="store_true", help="Enable SSE mode") parser.add_argument( "--port", type=int, default=8000, help="Port number for SSE server" ) return parser.parse_args() def main(): load_dotenv() args = parse_arguments() mcp.config = { "milvus_uri": os.environ.get("MILVUS_URI", args.milvus_uri), "milvus_token": os.environ.get("MILVUS_TOKEN", args.milvus_token), "db_name": os.environ.get("MILVUS_DB", args.milvus_db), } if args.sse: mcp.run(transport="sse", port=args.port, host="0.0.0.0") else: mcp.run() if __name__ == "__main__": main()

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/zilliztech/mcp-server-milvus'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

server.py•30.6 KiB