parquet mcp server

by DeepSpringAI
Verified

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Uses environment variables for configuration of embedding services, database connections, and model selection

  • Converts Parquet files to DuckDB databases for efficient querying and analysis

  • Stores embedding vectors as NumPy arrays in the Parquet file output

parquet_mcp_server

웹 검색을 수행하고 유사한 콘텐츠를 찾는 도구를 제공하는 강력한 MCP(모델 제어 프로토콜) 서버입니다. 이 서버는 Claude Desktop과 함께 작동하도록 설계되었으며 두 가지 주요 기능을 제공합니다.

  1. 웹 검색 : 웹 검색을 수행하고 결과를 스크래핑합니다.
  2. 유사 검색 : 이전 검색에서 관련 정보 추출

이 서버는 특히 다음과 같은 경우에 유용합니다.

  • 웹 검색 기능이 필요한 애플리케이션
  • 검색 쿼리를 기반으로 유사한 콘텐츠를 찾아야 하는 프로젝트

설치

Smithery를 통해 설치

Smithery를 통해 Claude Desktop용 Parquet MCP 서버를 자동으로 설치하려면:

지엑스피1

이 저장소를 복제하세요

git clone ... cd parquet_mcp_server

가상 환경 생성 및 활성화

uv venv .venv\Scripts\activate # On Windows source .venv/bin/activate # On macOS/Linux

패키지를 설치하세요

uv pip install -e .

환경

다음 변수를 사용하여 .env 파일을 만듭니다.

EMBEDDING_URL=http://sample-url.com/api/embed # URL for the embedding service OLLAMA_URL=http://sample-url.com/ # URL for Ollama server EMBEDDING_MODEL=sample-model # Model to use for generating embeddings SEARCHAPI_API_KEY=your_searchapi_api_key FIRECRAWL_API_KEY=your_firecrawl_api_key VOYAGE_API_KEY=your_voyage_api_key AZURE_OPENAI_ENDPOINT=http://sample-url.com/azure_openai AZURE_OPENAI_API_KEY=your_azure_openai_api_key

Claude Desktop과 함께 사용

Claude Desktop 구성 파일( claude_desktop_config.json )에 다음을 추가합니다.

{ "mcpServers": { "parquet-mcp-server": { "command": "uv", "args": [ "--directory", "/home/${USER}/workspace/parquet_mcp_server/src/parquet_mcp_server", "run", "main.py" ] } } }

사용 가능한 도구

서버는 두 가지 주요 도구를 제공합니다.

  1. 웹 검색 : 웹 검색을 수행하고 결과를 스크래핑합니다.
    • 필수 매개변수:
      • queries : 검색어 목록
    • 선택 매개변수:
      • page_number : 검색 결과의 페이지 번호(기본값은 1)
  2. 검색에서 정보 추출 : 이전 검색에서 관련 정보 추출
    • 필수 매개변수:
      • queries : 병합할 검색어 목록

예시 프롬프트

에이전트와 함께 사용할 수 있는 몇 가지 프롬프트 예시는 다음과 같습니다.

웹 검색의 경우:

"Please perform a web search for 'macbook' and 'laptop' and scrape the results from page 1"

검색에서 정보를 추출하려면:

"Please extract relevant information from the previous searches for 'macbook'"

MCP 서버 테스트

이 프로젝트에는 src/tests 디렉터리에 포괄적인 테스트 모음이 포함되어 있습니다. 다음을 사용하여 모든 테스트를 실행할 수 있습니다.

python src/tests/run_tests.py

또는 개별 테스트를 실행합니다.

# Test Web Search python src/tests/test_search_web.py # Test Extract Info from Search python src/tests/test_extract_info_from_search.py

클라이언트를 직접 사용하여 서버를 테스트할 수도 있습니다.

from parquet_mcp_server.client import ( perform_search_and_scrape, # New web search function find_similar_chunks # New extract info function ) # Perform a web search perform_search_and_scrape(["macbook", "laptop"], page_number=1) # Extract information from the search results find_similar_chunks(["macbook"])

문제 해결

  1. SSL 검증 오류가 발생하는 경우 .env 파일의 SSL 설정이 올바른지 확인하세요.
  2. 임베딩이 생성되지 않으면 다음을 확인하세요.
    • Ollama 서버가 실행 중이며 접근 가능합니다.
    • 지정된 모델은 Ollama 서버에서 사용 가능합니다.
    • 텍스트 열은 입력 Parquet 파일에 있습니다.
  3. DuckDB 변환이 실패하면 다음을 확인하세요.
    • 입력 Parquet 파일이 존재하며 읽을 수 있습니다.
    • 출력 디렉토리에 쓰기 권한이 있습니다.
    • Parquet 파일이 손상되지 않았습니다.
  4. PostgreSQL 변환이 실패하면 다음을 확인하세요.
    • .env 파일의 PostgreSQL 연결 설정이 올바릅니다.
    • PostgreSQL 서버가 실행 중이고 접근 가능합니다.
    • 테이블을 생성/수정하는 데 필요한 권한이 있습니다.
    • pgvector 확장 프로그램이 데이터베이스에 설치되었습니다.

You must be authenticated.

A
security – no known vulnerabilities
F
license - not found
A
quality - confirmed to work

Parquet 파일을 조작하고 분석하는 도구를 제공하는 강력한 MCP(모델 제어 프로토콜) 서버입니다. 이 서버는 Claude Desktop과 함께 작동하도록 설계되었으며, 네 가지 주요 기능을 제공합니다.

  1. Installation
    1. Installing via Smithery
    2. Clone this repository
    3. Create and activate virtual environment
    4. Install the package
    5. Environment
  2. Usage with Claude Desktop
    1. Available Tools
      1. Example Prompts
        1. For Web Search:
        2. For Extracting Info from Search:
      2. Testing the MCP Server
        1. Troubleshooting
      ID: tkclhe2kox