AINative ZeroDB MCP Server

EMBEDDING_TOOLS_GUIDE.md•14 KiB

# ZeroDB MCP Server - Embedding Tools Guide **Version:** 2.2.0 **Status:** Production Ready **Test Coverage:** 80.76% (151 passing tests) ## Overview The ZeroDB MCP Server now includes comprehensive embedding generation and semantic search capabilities with support for multiple vector dimensions (384, 768, 1024, 1536). This enables cost-effective vector storage and retrieval using free, open-source embedding models. ## New Features (Issue #311) ### 1. Multi-Dimension Support The MCP server now supports **4 dimension tiers** for vector embeddings: | Dimension | Model | Use Case | Storage | Quality | Speed | |-----------|-------|----------|---------|---------|-------| | **384** | BAAI/bge-small-en-v1.5 | General-purpose (default) | 1.5 KB | 62.4 MTEB | ⚡⚡⚡ Very Fast | | **768** | BAAI/bge-base-en-v1.5 | Higher quality search | 3 KB | 63.6 MTEB | ⚡⚡ Fast | | **1024** | BAAI/bge-large-en-v1.5 | Premium quality | 4 KB | 64.2 MTEB | ⚡ Medium | | **1536** | Custom/OpenAI | Legacy compatibility | 6 KB | Varies | N/A | ### 2. Three New MCP Tools #### `zerodb_generate_embeddings` Generate embeddings using specified model without storing them. ```javascript // Generate 384-dimension embeddings (default) const result = await mcp.call('zerodb_generate_embeddings', { texts: ['Document 1', 'Document 2', 'Document 3'] }); // Returns: { embeddings: [[...384 numbers]], dimensions: 384, model: 'BAAI/bge-small-en-v1.5' } // Generate 768-dimension embeddings const result = await mcp.call('zerodb_generate_embeddings', { texts: ['High quality document'], model: 'BAAI/bge-base-en-v1.5' }); // Returns: { embeddings: [[...768 numbers]], dimensions: 768 } ``` **Parameters:** - `texts` (required): Array of strings to embed - `model` (optional): Model to use (default: 'BAAI/bge-small-en-v1.5') - Options: `BAAI/bge-small-en-v1.5`, `BAAI/bge-base-en-v1.5`, `BAAI/bge-large-en-v1.5` --- #### `zerodb_embed_and_store` Generate embeddings AND store them in ZeroDB in one operation. ```javascript // One-step embed and store (384-dim) const result = await mcp.call('zerodb_embed_and_store', { texts: [ 'ZeroDB is a vector database', 'It supports semantic search', 'Built for AI applications' ], namespace: 'my-knowledge-base', metadata: { source: 'documentation', category: 'technical' } }); // Returns: { vectors_stored: 3, dimensions: 384, vector_ids: [...] } // Use 768-dim model for better quality const result = await mcp.call('zerodb_embed_and_store', { texts: ['Critical business document'], model: 'BAAI/bge-base-en-v1.5', namespace: 'high-priority' }); // Returns: { vectors_stored: 1, dimensions: 768, vector_ids: [...] } ``` **Parameters:** - `texts` (required): Array of strings to embed and store - `model` (optional): Embedding model (default: 'BAAI/bge-small-en-v1.5') - `namespace` (optional): Vector namespace (default: 'default') - `metadata` (optional): Metadata to attach to all vectors --- #### `zerodb_semantic_search` Search vectors using natural language queries (auto-embeds query). ```javascript // Simple semantic search (384-dim) const result = await mcp.call('zerodb_semantic_search', { query_text: 'How do I use vector databases?', limit: 5 }); // Returns: { total_results: 3, results: [{ id, score, document }...] } // Search with filters and custom model const result = await mcp.call('zerodb_semantic_search', { query_text: 'machine learning best practices', model: 'BAAI/bge-base-en-v1.5', namespace: 'ml-docs', limit: 10, threshold: 0.8, filter_metadata: { category: 'tutorial' } }); ``` **Parameters:** - `query_text` (required): Natural language search query - `model` (optional): Model for embedding query (default: 'BAAI/bge-small-en-v1.5') - `namespace` (optional): Namespace to search (default: 'default') - `limit` (optional): Max results (default: 10) - `threshold` (optional): Minimum similarity score 0.0-1.0 (default: 0.7) - `filter_metadata` (optional): Metadata filters --- ### 3. Updated Existing Tools #### `zerodb_upsert_vector` Now supports **384, 768, 1024, AND 1536** dimensions (previously 1536 only). ```javascript // Store 384-dim vector await mcp.call('zerodb_upsert_vector', { vector_embedding: [...384 numbers], document: 'My document', namespace: 'docs' }); // Store 768-dim vector await mcp.call('zerodb_upsert_vector', { vector_embedding: [...768 numbers], document: 'Important doc', namespace: 'priority' }); // Still supports 1536-dim (legacy/OpenAI) await mcp.call('zerodb_upsert_vector', { vector_embedding: [...1536 numbers], document: 'OpenAI embedded doc' }); ``` --- #### `zerodb_search_vectors` Now accepts query vectors of **384, 768, 1024, OR 1536** dimensions. ```javascript // Search with 384-dim query vector await mcp.call('zerodb_search_vectors', { query_vector: [...384 numbers], limit: 10 }); // Search with 768-dim query vector await mcp.call('zerodb_search_vectors', { query_vector: [...768 numbers], namespace: 'high-quality' }); ``` --- ## Complete RAG Workflow Example ```javascript // === STEP 1: Embed and Store Documents === const storeResult = await mcp.call('zerodb_embed_and_store', { texts: [ 'ZeroDB is a vector database optimized for AI applications.', 'It supports semantic search with multiple embedding models.', 'You can use 384, 768, 1024, or 1536 dimension vectors.' ], model: 'BAAI/bge-small-en-v1.5', // Free 384-dim model namespace: 'zerodb-docs', metadata: { source: 'documentation', version: '2.2.0' } }); console.log(`Stored ${storeResult.vectors_stored} vectors`); // Output: Stored 3 vectors // === STEP 2: Semantic Search === const searchResult = await mcp.call('zerodb_semantic_search', { query_text: 'What dimensions does ZeroDB support?', model: 'BAAI/bge-small-en-v1.5', // Must match storage model namespace: 'zerodb-docs', limit: 2, threshold: 0.7 }); console.log(`Found ${searchResult.total_results} results`); searchResult.results.forEach((result, i) => { console.log(`${i+1}. [Score: ${result.score.toFixed(3)}] ${result.document}`); }); // Output: // Found 2 results // 1. [Score: 0.953] You can use 384, 768, 1024, or 1536 dimension vectors. // 2. [Score: 0.847] It supports semantic search with multiple embedding models. // === STEP 3: Generate Embeddings for External Use === const embedResult = await mcp.call('zerodb_generate_embeddings', { texts: ['Custom document for external processing'], model: 'BAAI/bge-base-en-v1.5' // 768-dim }); console.log(`Generated embedding with ${embedResult.dimensions} dimensions`); // Output: Generated embedding with 768 dimensions ``` --- ## Dimension Selection Guide ### When to Use 384 Dimensions (BAAI/bge-small-en-v1.5) ✅ **Best for:** - General-purpose applications (80% of use cases) - High-volume document storage - Fast retrieval requirements - Cost-sensitive projects **Pros:** - Smallest storage footprint (1.5 KB per vector) - Fastest search performance - Free to use (no API costs) - Good quality for most tasks (62.4 MTEB score) **Cons:** - Slightly lower accuracy than larger models --- ### When to Use 768 Dimensions (BAAI/bge-base-en-v1.5) ✅ **Best for:** - Higher quality search needs - Business-critical applications - E-commerce product search - Legal/medical document retrieval **Pros:** - Better accuracy (63.6 MTEB score) - Still fast performance - Free to use - 2x storage vs 384-dim **Cons:** - Larger storage requirements --- ### When to Use 1024 Dimensions (BAAI/bge-large-en-v1.5) ✅ **Best for:** - Premium quality requirements - Research applications - Mission-critical search - When accuracy is paramount **Pros:** - Best accuracy (64.2 MTEB score) - Still free to use - Production-grade quality **Cons:** - Larger storage (4 KB per vector) - Slower than smaller models --- ### When to Use 1536 Dimensions (OpenAI/Custom) ✅ **Best for:** - Migrating from OpenAI embeddings - When you have existing 1536-dim vectors - Specific custom model requirements **Pros:** - OpenAI compatibility - Widely supported **Cons:** - Largest storage (6 KB per vector) - May require paid API (if using OpenAI) --- ## Dimension Validation The MCP server automatically validates vector dimensions: ```javascript // ✅ Valid dimensions (auto-detected) await mcp.call('zerodb_upsert_vector', { vector_embedding: [...384 numbers] // Valid: 384-dim }); await mcp.call('zerodb_upsert_vector', { vector_embedding: [...768 numbers] // Valid: 768-dim }); await mcp.call('zerodb_upsert_vector', { vector_embedding: [...1024 numbers] // Valid: 1024-dim }); await mcp.call('zerodb_upsert_vector', { vector_embedding: [...1536 numbers] // Valid: 1536-dim }); // ❌ Invalid dimensions (will be rejected by backend) await mcp.call('zerodb_upsert_vector', { vector_embedding: [...512 numbers] // Error: Unsupported dimension }); ``` **Supported Dimensions:** 384, 768, 1024, 1536 **Validation:** Backend enforces dimension constraints --- ## Migration from OpenAI (1536-dim → 384/768/1024) If you're currently using OpenAI embeddings (1536 dimensions), you can migrate to free models: ### Step 1: Generate new embeddings with free model ```javascript // Re-embed your documents with free model const docs = ['Document 1', 'Document 2', 'Document 3']; const newEmbeddings = await mcp.call('zerodb_generate_embeddings', { texts: docs, model: 'BAAI/bge-small-en-v1.5' // Free 384-dim model }); ``` ### Step 2: Store in new namespace ```javascript await mcp.call('zerodb_embed_and_store', { texts: docs, model: 'BAAI/bge-small-en-v1.5', namespace: 'new-free-embeddings' }); ``` ### Step 3: Compare quality and switch ```javascript // Test search quality const query = 'your test query'; // Old (OpenAI 1536-dim) const oldResults = await mcp.call('zerodb_semantic_search', { query_text: query, namespace: 'old-openai-embeddings' }); // New (Free 384-dim) const newResults = await mcp.call('zerodb_semantic_search', { query_text: query, model: 'BAAI/bge-small-en-v1.5', namespace: 'new-free-embeddings' }); // Compare and switch if quality is acceptable ``` **Cost Savings:** $0.0001/1K tokens → $0 (100% free) --- ## Testing ### Run Embedding Tests ```bash cd zerodb-mcp-server npm test -- __tests__/embeddings.test.js ``` **Test Results:** - ✅ 37 tests passing - ✅ Dimension validation (10 tests) - ✅ Generate embeddings (5 tests) - ✅ Embed and store (3 tests) - ✅ Semantic search (6 tests) - ✅ Multi-dimension support (10 tests) - ✅ Integration workflows (3 tests) ### Run All Tests ```bash npm test ``` **Overall Coverage:** - Statement Coverage: **80.76%** - Branch Coverage: **90.83%** - Function Coverage: **71.42%** - Line Coverage: **81.29%** - Total Tests: **151 passing** --- ## Troubleshooting ### Issue: "Unsupported dimension" error **Cause:** Vector dimension not in [384, 768, 1024, 1536] **Solution:** Use one of the supported models or check your vector length ```javascript // ✅ Correct const result = await mcp.call('zerodb_generate_embeddings', { texts: ['text'], model: 'BAAI/bge-small-en-v1.5' // Generates 384-dim }); // ❌ Wrong - custom dimension const vector = [...512]; // Not supported ``` --- ### Issue: Search returns no results **Cause:** Query and stored vectors have different dimensions **Solution:** Ensure query model matches storage model ```javascript // ✅ Correct - dimensions match await mcp.call('zerodb_embed_and_store', { texts: ['doc'], model: 'BAAI/bge-small-en-v1.5' // 384-dim }); await mcp.call('zerodb_semantic_search', { query_text: 'query', model: 'BAAI/bge-small-en-v1.5' // Same model = 384-dim }); // ❌ Wrong - dimension mismatch await mcp.call('zerodb_embed_and_store', { texts: ['doc'], model: 'BAAI/bge-small-en-v1.5' // 384-dim }); await mcp.call('zerodb_semantic_search', { query_text: 'query', model: 'BAAI/bge-base-en-v1.5' // Different model = 768-dim }); ``` --- ### Issue: Backend API returns error **Cause:** Issue #310 (Embeddings API) not yet deployed **Status:** Wait for Issue #310 completion before integration testing **Workaround:** Tests use mocked API responses --- ## Dependencies ### Required (Issue #310) The embedding tools require the backend Embeddings API to be deployed: - ⏳ **Issue #310:** Embeddings API with multi-dimension support - Endpoint: `POST /v1/public/zerodb/mcp/execute` - Operations: `generate_embeddings`, `embed_and_store`, `semantic_search` ### Backend Requirements - Railway Embeddings Service with 3 models: - `BAAI/bge-small-en-v1.5` (384-dim) - `BAAI/bge-base-en-v1.5` (768-dim) - `BAAI/bge-large-en-v1.5` (1024-dim) --- ## Changelog ### Version 2.2.0 (Issue #311) **Added:** - ✅ `zerodb_generate_embeddings` tool (3 model options) - ✅ `zerodb_embed_and_store` tool (one-step workflow) - ✅ `zerodb_semantic_search` tool (text-to-vector search) - ✅ `validateVectorDimension()` utility function - ✅ Support for 384, 768, 1024, 1536 dimensions **Updated:** - ✅ `zerodb_upsert_vector` - Multi-dimension support - ✅ `zerodb_search_vectors` - Multi-dimension support - ✅ Tool descriptions with dimension info **Testing:** - ✅ 37 new embedding-specific tests - ✅ 151 total tests passing - ✅ 80.76% statement coverage - ✅ 90.83% branch coverage **Documentation:** - ✅ EMBEDDING_TOOLS_GUIDE.md (this file) - ✅ Updated README.md - ✅ Test coverage reports --- ## Future Enhancements - [ ] Client-side dimension validation (pre-API call) - [ ] Automatic model selection based on text length - [ ] Batch embedding with progress callbacks - [ ] Caching for frequently used embeddings - [ ] Support for custom embedding models - [ ] Vector quantization for storage optimization --- ## Resources - **Main Documentation:** [README.md](./README.md) - **Multi-Dimension Plan:** [ZeroDB_Multi_Dimension_Implementation_Plan.md](/docs/Zero-DB/ZeroDB_Multi_Dimension_Implementation_Plan.md) - **API Reference:** https://www.ainative.studio/api-reference - **BGE Models:** https://huggingface.co/BAAI - **MTEB Leaderboard:** https://huggingface.co/spaces/mteb/leaderboard --- **Issue #311 Status:** ✅ **COMPLETED** **Author:** AI Native Development Team **Last Updated:** 2025-12-14 **Test Coverage:** 80.76% (151 passing tests)

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/AINative-Studio/ainative-zerodb-mcp-server'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

EMBEDDING_TOOLS_GUIDE.md•14 KiB