Simple Files Vector Store Server

by lishenxydlgzs
Verified

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Supports .gitignore-style file exclusion patterns through the IGNORE_FILE configuration to control which files are indexed.

  • Supports indexing and searching Markdown files, allowing semantic queries across Markdown document content.

@lishenxydlgzs/archivos-simples-vectorstore

Un servidor de Protocolo de Contexto de Modelo (MCP) que proporciona funciones de búsqueda semántica en archivos. Este servidor supervisa directorios específicos y crea incrustaciones vectoriales del contenido de los archivos, lo que permite la búsqueda semántica en sus documentos.

Instalación y uso

Agregue a su archivo de configuración de MCP:

{ "mcpServers": { "files-vectorstore": { "command": "npx", "args": [ "-y", "@lishenxydlgzs/simple-files-vectorstore" ], "env": { "WATCH_DIRECTORIES": "/path/to/your/directories" }, "disabled": false, "autoApprove": [] } } }

Ubicaciones de los archivos de configuración de MCP:

  • Extensión Cline de VSCode: ~/Library/Application Support/Code/User/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json
  • Aplicación de escritorio de Claude: ~/Library/Application Support/Claude/claude_desktop_config.json

Configuración

El servidor requiere configuración a través de variables de entorno:

Variables de entorno requeridas

Debes especificar los directorios que deseas vigilar utilizando UNO de los siguientes métodos:

  • WATCH_DIRECTORIES : Lista separada por comas de directorios para vigilar
  • WATCH_CONFIG_FILE : Ruta a un archivo de configuración JSON con una matriz watchList

Ejemplo utilizando WATCH_DIRECTORIES:

{ "mcpServers": { "files-vectorstore": { "command": "npx", "args": [ "-y", "@lishenxydlgzs/simple-files-vectorstore" ], "env": { "WATCH_DIRECTORIES": "/path/to/dir1,/path/to/dir2" }, "disabled": false, "autoApprove": [] } } }

Ejemplo usando WATCH_CONFIG_FILE:

{ "mcpServers": { "files-vectorstore": { "command": "npx", "args": [ "-y", "@lishenxydlgzs/simple-files-vectorstore" ], "env": { "WATCH_CONFIG_FILE": "/path/to/watch-config.json" }, "disabled": false, "autoApprove": [] } } }

El archivo de configuración del reloj debe tener la siguiente estructura:

{ "watchList": [ "/path/to/dir1", "/path/to/dir2", "/path/to/specific/file.txt" ] }

Variables de entorno opcionales

  • CHUNK_SIZE : Tamaño de los fragmentos de texto para procesamiento (predeterminado: 1000)
  • CHUNK_OVERLAP : Superposición entre fragmentos (valor predeterminado: 200)
  • IGNORE_FILE : Ruta a un archivo de estilo .gitignore para excluir archivos/directorios según patrones

Ejemplo con todos los parámetros opcionales:

{ "mcpServers": { "files-vectorstore": { "command": "npx", "args": [ "-y", "@lishenxydlgzs/simple-files-vectorstore" ], "env": { "WATCH_DIRECTORIES": "/path/to/dir1,/path/to/dir2", "CHUNK_SIZE": "2000", "CHUNK_OVERLAP": "500", "IGNORE_FILE": "/path/to/.gitignore" }, "disabled": false, "autoApprove": [] } } }

Herramientas MCP

Este servidor proporciona las siguientes herramientas MCP:

1. búsqueda

Realizar búsqueda semántica en archivos indexados.

Parámetros:

  • query (obligatoria): La cadena de consulta de búsqueda
  • limit (opcional): número máximo de resultados a devolver (predeterminado: 5, máximo: 20)

Ejemplo de respuesta:

[ { "content": "matched text content", "source": "/path/to/file", "fileType": "markdown", "score": 0.85 } ]

2. obtener_estadísticas

Obtenga estadísticas sobre los archivos indexados.

Parámetros: Ninguno

Ejemplo de respuesta:

{ "totalDocuments": 42, "watchedDirectories": ["/path/to/docs"], "processingFiles": [] }

Características

  • Observación e indexación de archivos en tiempo real
  • Búsqueda semántica mediante incrustaciones vectoriales
  • Compatibilidad con múltiples tipos de archivos
  • Tamaño de fragmento y superposición configurables
  • Procesamiento de archivos en segundo plano
  • Manejo automático de cambios y eliminaciones de archivos

Repositorio

Repositorio de GitHub

-
security - not tested
A
license - permissive license
-
quality - not tested

Un almacén de vectores muy simple que proporciona la capacidad de observar una lista de directorios e indexar automáticamente todos los archivos markdown, html y de texto en el directorio en un almacén de vectores para mejorar el contexto.

  1. Installation & Usage
    1. Configuration
      1. Required Environment Variables
      2. Optional Environment Variables
    2. MCP Tools
      1. 1. search
      2. 2. get_stats
    3. Features
      1. Repository
        ID: 8az6gm4zz3