MCP Embedding Search

by spences10
Verified

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Integrations

  • Provides vector similarity search capabilities for transcript segments stored in a Turso database, retrieving relevant content based on natural language queries without generating new embeddings

búsqueda de incrustación de mcp

Un servidor de Protocolo de Contexto de Modelo (MCP) que consulta una base de datos Turso que contiene incrustaciones y segmentos de transcripción. Esta herramienta permite a los usuarios buscar segmentos de transcripción relevantes mediante preguntas, sin generar nuevas incrustaciones.

Características

  • 🔍 Búsqueda de similitud vectorial para segmentos de transcripción
  • Puntuación de relevancia basada en la similitud del coseno
  • 📝 Metadatos de la transcripción completa (título del episodio, marcas de tiempo)
  • ⚙️ Parámetros de búsqueda configurables (límite, puntuación mínima)
  • 🔄 Agrupación eficiente de conexiones de bases de datos
  • 🛡️ Manejo integral de errores
  • 📈 Rendimiento optimizado para respuestas rápidas

Configuración

Este servidor requiere configuración a través de su cliente MCP. A continuación, se muestran ejemplos para diferentes entornos:

Configuración de Cline

Agregue esto a su configuración de Cline MCP:

{ "mcpServers": { "mcp-embedding-search": { "command": "node", "args": ["/path/to/mcp-embedding-search/dist/index.js"], "env": { "TURSO_URL": "your-turso-database-url", "TURSO_AUTH_TOKEN": "your-turso-auth-token" } } } }

Configuración del escritorio de Claude

Añade esto a tu configuración de Claude Desktop:

{ "mcpServers": { "mcp-embedding-search": { "command": "node", "args": ["/path/to/mcp-embedding-search/dist/index.js"], "env": { "TURSO_URL": "your-turso-database-url", "TURSO_AUTH_TOKEN": "your-turso-auth-token" } } } }

API

El servidor implementa una herramienta MCP:

incrustaciones de búsqueda

Busque segmentos de transcripción relevantes utilizando similitud vectorial.

Parámetros:

  • question (cadena, obligatoria): el texto de consulta a buscar
  • limit (número, opcional): Número de resultados a devolver (predeterminado: 5, máximo: 50)
  • min_score (número, opcional): umbral mínimo de similitud (predeterminado: 0,5, rango: 0-1)

Formato de respuesta:

[ { "episode_title": "Episode Title", "segment_text": "Transcript segment content...", "start_time": 123.45, "end_time": 167.89, "similarity": 0.85 } // Additional results... ]

Esquema de base de datos

Esta herramienta espera una base de datos Turso con el siguiente esquema:

CREATE TABLE embeddings ( id INTEGER PRIMARY KEY AUTOINCREMENT, transcript_id INTEGER NOT NULL, embedding TEXT NOT NULL, FOREIGN KEY(transcript_id) REFERENCES transcripts(id) ); CREATE TABLE transcripts ( id INTEGER PRIMARY KEY AUTOINCREMENT, episode_title TEXT NOT NULL, segment_text TEXT NOT NULL, start_time REAL NOT NULL, end_time REAL NOT NULL );

La columna embedding debe contener incrustaciones vectoriales que puedan usarse con la función vector_distance_cos .

Desarrollo

Configuración

  1. Clonar el repositorio
  2. Instalar dependencias:
npm install
  1. Construir el proyecto:
npm run build
  1. Ejecutar en modo de desarrollo:
npm run dev

Publicación

El proyecto utiliza conjuntos de cambios para la gestión de versiones. Para publicar:

  1. Crear un conjunto de cambios:
npm run changeset
  1. Versionar el paquete:
npm run version
  1. Publicar en npm:
npm run release

Contribuyendo

¡Agradecemos sus contribuciones! No dude en enviar una solicitud de incorporación de cambios.

Licencia

Licencia MIT: consulte el archivo LICENCIA para obtener más detalles.

Expresiones de gratitud

  • Construido sobre el Protocolo de Contexto Modelo
  • Diseñado para una búsqueda eficiente de similitud de vectores en bases de datos de transcripciones
-
security - not tested
F
license - not found
-
quality - not tested

Un servidor de protocolo de contexto modelo que busca segmentos de transcripción en una base de datos Turso utilizando similitud vectorial, lo que permite a los usuarios encontrar contenido relevante haciendo preguntas sin generar nuevas incrustaciones.

  1. Features
    1. Configuration
      1. Cline Configuration
      2. Claude Desktop Configuration
    2. API
      1. search_embeddings
    3. Database Schema
      1. Development
        1. Setup
        2. Publishing
      2. Contributing
        1. License
          1. Acknowledgments
            ID: f274w82274