데이터셋 뷰어 MCP 서버
Hugging Face Dataset Viewer API 와 상호 작용하기 위한 MCP 서버로, Hugging Face Hub에 호스팅된 데이터 세트를 탐색하고 분석하는 기능을 제공합니다.
특징
자원
Hugging Face 데이터세트에 액세스하기 위해
dataset://URI 체계를 사용합니다.데이터 세트 구성 및 분할 지원
데이터 세트 콘텐츠에 대한 페이지별 액세스를 제공합니다.
개인 데이터 세트에 대한 인증을 처리합니다.
데이터세트 콘텐츠 검색 및 필터링 지원
데이터 세트 통계 및 분석 제공
도구
서버는 다음과 같은 도구를 제공합니다.
검증하다
데이터 세트가 존재하고 접근 가능한지 확인하세요
매개변수:
dataset: 데이터 세트 식별자(예: 'stanfordnlp/imdb')auth_token(선택 사항): 개인 데이터 세트의 경우
정보 얻기
데이터 세트에 대한 자세한 정보를 얻으세요
매개변수:
dataset: 데이터 세트 식별자auth_token(선택 사항): 개인 데이터 세트의 경우
행을 얻으세요
데이터 세트의 페이지 매김된 콘텐츠 가져오기
매개변수:
dataset: 데이터 세트 식별자config: 구성 이름split: 분할 이름page(선택 사항): 페이지 번호(0부터 시작)auth_token(선택 사항): 개인 데이터 세트의 경우
첫 번째 행 가져오기
데이터 세트 분할에서 첫 번째 행 가져오기
매개변수:
dataset: 데이터 세트 식별자config: 구성 이름split: 분할 이름auth_token(선택 사항): 개인 데이터 세트의 경우
통계 얻기
데이터 세트 분할에 대한 통계 가져오기
매개변수:
dataset: 데이터 세트 식별자config: 구성 이름split: 분할 이름auth_token(선택 사항): 개인 데이터 세트의 경우
검색_데이터셋
데이터 세트 내에서 텍스트 검색
매개변수:
dataset: 데이터 세트 식별자config: 구성 이름split: 분할 이름query: 검색할 텍스트auth_token(선택 사항): 개인 데이터 세트의 경우
필터
SQL과 유사한 조건을 사용하여 행 필터링
매개변수:
dataset: 데이터 세트 식별자config: 구성 이름split: 분할 이름where: SQL WHERE 절(예: "score > 0.5")orderby(선택 사항): SQL ORDER BY 절page(선택 사항): 페이지 번호(0부터 시작)auth_token(선택 사항): 개인 데이터 세트의 경우
get_parquet
Parquet 형식으로 전체 데이터 세트 다운로드
매개변수:
dataset: 데이터 세트 식별자auth_token(선택 사항): 개인 데이터 세트의 경우
Related MCP server: Hugging Face Hub Semantic Search MCP
설치
필수 조건
Python 3.12 이상
uv - 빠른 Python 패키지 설치 및 확인 프로그램
설정
저장소를 복제합니다.
지엑스피1
가상 환경을 만들고 설치하세요.
구성
환경 변수
HUGGINGFACE_TOKEN: 개인 데이터 세트에 액세스하기 위한 Hugging Face API 토큰
Claude 데스크톱 통합
Claude Desktop 구성 파일에 다음을 추가하세요.
Windows의 경우: %APPDATA%\Claude\claude_desktop_config.json
MacOS의 경우: ~/Library/Application Support/Claude/claude_desktop_config.json
특허
MIT 라이선스 - 자세한 내용은 라이선스를 참조하세요.