Skip to main content
Glama
privetin

Dataset Viewer MCP Server

by privetin

데이터셋 뷰어 MCP 서버

Hugging Face Dataset Viewer API 와 상호 작용하기 위한 MCP 서버로, Hugging Face Hub에 호스팅된 데이터 세트를 탐색하고 분석하는 기능을 제공합니다.

특징

자원

  • Hugging Face 데이터세트에 액세스하기 위해 dataset:// URI 체계를 사용합니다.

  • 데이터 세트 구성 및 분할 지원

  • 데이터 세트 콘텐츠에 대한 페이지별 액세스를 제공합니다.

  • 개인 데이터 세트에 대한 인증을 처리합니다.

  • 데이터세트 콘텐츠 검색 및 필터링 지원

  • 데이터 세트 통계 및 분석 제공

도구

서버는 다음과 같은 도구를 제공합니다.

  1. 검증하다

    • 데이터 세트가 존재하고 접근 가능한지 확인하세요

    • 매개변수:

      • dataset : 데이터 세트 식별자(예: 'stanfordnlp/imdb')

      • auth_token (선택 사항): 개인 데이터 세트의 경우

  2. 정보 얻기

    • 데이터 세트에 대한 자세한 정보를 얻으세요

    • 매개변수:

      • dataset : 데이터 세트 식별자

      • auth_token (선택 사항): 개인 데이터 세트의 경우

  3. 행을 얻으세요

    • 데이터 세트의 페이지 매김된 콘텐츠 가져오기

    • 매개변수:

      • dataset : 데이터 세트 식별자

      • config : 구성 이름

      • split : 분할 이름

      • page (선택 사항): 페이지 번호(0부터 시작)

      • auth_token (선택 사항): 개인 데이터 세트의 경우

  4. 첫 번째 행 가져오기

    • 데이터 세트 분할에서 첫 번째 행 가져오기

    • 매개변수:

      • dataset : 데이터 세트 식별자

      • config : 구성 이름

      • split : 분할 이름

      • auth_token (선택 사항): 개인 데이터 세트의 경우

  5. 통계 얻기

    • 데이터 세트 분할에 대한 통계 가져오기

    • 매개변수:

      • dataset : 데이터 세트 식별자

      • config : 구성 이름

      • split : 분할 이름

      • auth_token (선택 사항): 개인 데이터 세트의 경우

  6. 검색_데이터셋

    • 데이터 세트 내에서 텍스트 검색

    • 매개변수:

      • dataset : 데이터 세트 식별자

      • config : 구성 이름

      • split : 분할 이름

      • query : 검색할 텍스트

      • auth_token (선택 사항): 개인 데이터 세트의 경우

  7. 필터

    • SQL과 유사한 조건을 사용하여 행 필터링

    • 매개변수:

      • dataset : 데이터 세트 식별자

      • config : 구성 이름

      • split : 분할 이름

      • where : SQL WHERE 절(예: "score > 0.5")

      • orderby (선택 사항): SQL ORDER BY 절

      • page (선택 사항): 페이지 번호(0부터 시작)

      • auth_token (선택 사항): 개인 데이터 세트의 경우

  8. get_parquet

    • Parquet 형식으로 전체 데이터 세트 다운로드

    • 매개변수:

      • dataset : 데이터 세트 식별자

      • auth_token (선택 사항): 개인 데이터 세트의 경우

Related MCP server: Hugging Face Hub Semantic Search MCP

설치

필수 조건

  • Python 3.12 이상

  • uv - 빠른 Python 패키지 설치 및 확인 프로그램

설정

  1. 저장소를 복제합니다.

지엑스피1

  1. 가상 환경을 만들고 설치하세요.

# Create virtual environment
uv venv

# Activate virtual environment
# On Unix:
source .venv/bin/activate
# On Windows:
.venv\Scripts\activate

# Install in development mode
uv add -e .

구성

환경 변수

  • HUGGINGFACE_TOKEN : 개인 데이터 세트에 액세스하기 위한 Hugging Face API 토큰

Claude 데스크톱 통합

Claude Desktop 구성 파일에 다음을 추가하세요.

Windows의 경우: %APPDATA%\Claude\claude_desktop_config.json

MacOS의 경우: ~/Library/Application Support/Claude/claude_desktop_config.json

{
  "mcpServers": {
    "dataset-viewer": {
      "command": "uv",
      "args": [
        "--directory",
        "parent_to_repo/dataset-viewer",
        "run",
        "dataset-viewer"
      ]
    }
  }
}

특허

MIT 라이선스 - 자세한 내용은 라이선스를 참조하세요.

Install Server
A
license - permissive license
B
quality
D
maintenance

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/privetin/dataset-viewer'

If you have feedback or need assistance with the MCP directory API, please join our Discord server