parquet mcp server

by DeepSpringAI
Verified

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Uses environment variables for configuration of embedding services, database connections, and model selection

  • Converts Parquet files to DuckDB databases for efficient querying and analysis

  • Stores embedding vectors as NumPy arrays in the Parquet file output

servidor parquet_mcp

Un potente servidor MCP (Protocolo de Control de Modelos) que proporciona herramientas para realizar búsquedas web y encontrar contenido similar. Este servidor está diseñado para funcionar con Claude Desktop y ofrece dos funcionalidades principales:

  1. Búsqueda web : realice una búsqueda web y extraiga resultados
  2. Búsqueda de similitud : extrae información relevante de búsquedas anteriores

Este servidor es particularmente útil para:

  • Aplicaciones que requieren capacidades de búsqueda web
  • Proyectos que necesitan encontrar contenido similar según consultas de búsqueda

Instalación

Instalación mediante herrería

Para instalar Parquet MCP Server para Claude Desktop automáticamente a través de Smithery :

npx -y @smithery/cli install @DeepSpringAI/parquet_mcp_server --client claude

Clonar este repositorio

git clone ... cd parquet_mcp_server

Crear y activar entorno virtual

uv venv .venv\Scripts\activate # On Windows source .venv/bin/activate # On macOS/Linux

Instalar el paquete

uv pip install -e .

Ambiente

Crea un archivo .env con las siguientes variables:

EMBEDDING_URL=http://sample-url.com/api/embed # URL for the embedding service OLLAMA_URL=http://sample-url.com/ # URL for Ollama server EMBEDDING_MODEL=sample-model # Model to use for generating embeddings SEARCHAPI_API_KEY=your_searchapi_api_key FIRECRAWL_API_KEY=your_firecrawl_api_key VOYAGE_API_KEY=your_voyage_api_key AZURE_OPENAI_ENDPOINT=http://sample-url.com/azure_openai AZURE_OPENAI_API_KEY=your_azure_openai_api_key

Uso con Claude Desktop

Agregue esto a su archivo de configuración de Claude Desktop ( claude_desktop_config.json ):

{ "mcpServers": { "parquet-mcp-server": { "command": "uv", "args": [ "--directory", "/home/${USER}/workspace/parquet_mcp_server/src/parquet_mcp_server", "run", "main.py" ] } } }

Herramientas disponibles

El servidor proporciona dos herramientas principales:

  1. Buscar en la Web : Realizar una búsqueda web y extraer resultados
    • Parámetros requeridos:
      • queries : Lista de consultas de búsqueda
    • Parámetros opcionales:
      • page_number : Número de página para los resultados de la búsqueda (predeterminado en 1)
  2. Extraer información de la búsqueda : extrae información relevante de búsquedas anteriores
    • Parámetros requeridos:
      • queries : Lista de consultas de búsqueda para fusionar

Ejemplos de indicaciones

A continuación se muestran algunos ejemplos de indicaciones que puede utilizar con el agente:

Para búsqueda web:

"Please perform a web search for 'macbook' and 'laptop' and scrape the results from page 1"

Para extraer información de la búsqueda:

"Please extract relevant information from the previous searches for 'macbook'"

Prueba del servidor MCP

El proyecto incluye un conjunto completo de pruebas en el directorio src/tests . Puede ejecutar todas las pruebas usando:

python src/tests/run_tests.py

O ejecutar pruebas individuales:

# Test Web Search python src/tests/test_search_web.py # Test Extract Info from Search python src/tests/test_extract_info_from_search.py

También puedes probar el servidor utilizando el cliente directamente:

from parquet_mcp_server.client import ( perform_search_and_scrape, # New web search function find_similar_chunks # New extract info function ) # Perform a web search perform_search_and_scrape(["macbook", "laptop"], page_number=1) # Extract information from the search results find_similar_chunks(["macbook"])

Solución de problemas

  1. Si recibe errores de verificación de SSL, asegúrese de que la configuración de SSL en su archivo .env sea correcta
  2. Si no se generan incrustaciones, verifique:
    • El servidor Ollama está en funcionamiento y es accesible.
    • El modelo especificado está disponible en su servidor Ollama
    • La columna de texto existe en su archivo de entrada Parquet
  3. Si falla la conversión de DuckDB, verifique:
    • El archivo Parquet de entrada existe y es legible
    • Tiene permisos de escritura en el directorio de salida
    • El archivo Parquet no está dañado
  4. Si falla la conversión de PostgreSQL, verifique:
    • La configuración de conexión de PostgreSQL en su archivo .env es correcta
    • El servidor PostgreSQL está en ejecución y es accesible
    • Tienes los permisos necesarios para crear/modificar tablas
    • La extensión pgvector está instalada en su base de datos

You must be authenticated.

A
security – no known vulnerabilities
F
license - not found
A
quality - confirmed to work

Un potente servidor MCP (Protocolo de Control de Modelos) que proporciona herramientas para manipular y analizar archivos Parquet. Este servidor está diseñado para funcionar con Claude Desktop y ofrece cuatro funcionalidades principales:

  1. Installation
    1. Installing via Smithery
    2. Clone this repository
    3. Create and activate virtual environment
    4. Install the package
    5. Environment
  2. Usage with Claude Desktop
    1. Available Tools
      1. Example Prompts
        1. For Web Search:
        2. For Extracting Info from Search:
      2. Testing the MCP Server
        1. Troubleshooting
      ID: tkclhe2kox