Servidor MCP del visor de conjuntos de datos
Un servidor MCP para interactuar con la API del visualizador de conjuntos de datos de Hugging Face , que proporciona capacidades para explorar y analizar conjuntos de datos alojados en Hugging Face Hub.
Características
Recursos
Utiliza el esquema URI
dataset://para acceder a los conjuntos de datos de Hugging FaceAdmite configuraciones y divisiones de conjuntos de datos
Proporciona acceso paginado al contenido del conjunto de datos
Maneja la autenticación para conjuntos de datos privados
Admite la búsqueda y el filtrado de contenidos de conjuntos de datos.
Proporciona estadísticas y análisis de conjuntos de datos.
Herramientas
El servidor proporciona las siguientes herramientas:
validar
Comprobar si un conjunto de datos existe y es accesible
Parámetros:
dataset: identificador del conjunto de datos (por ejemplo, 'stanfordnlp/imdb')auth_token(opcional): para conjuntos de datos privados
obtener_información
Obtenga información detallada sobre un conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosauth_token(opcional): para conjuntos de datos privados
obtener_filas
Obtener el contenido paginado de un conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombrepage(opcional): Número de página (basado en 0)auth_token(opcional): para conjuntos de datos privados
obtener_primeras_filas
Obtener las primeras filas de una división del conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombreauth_token(opcional): para conjuntos de datos privados
obtener_estadísticas
Obtener estadísticas sobre una división del conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombreauth_token(opcional): para conjuntos de datos privados
conjunto de datos de búsqueda
Buscar texto dentro de un conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombrequery: Texto a buscarauth_token(opcional): para conjuntos de datos privados
filtrar
Filtrar filas usando condiciones similares a SQL
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombrewhere: cláusula WHERE de SQL (por ejemplo, "puntuación > 0,5")orderby(opcional): cláusula ORDER BY de SQLpage(opcional): Número de página (basado en 0)auth_token(opcional): para conjuntos de datos privados
obtener_parquet
Descargar el conjunto de datos completo en formato Parquet
Parámetros:
dataset: identificador del conjunto de datosauth_token(opcional): para conjuntos de datos privados
Instalación
Prerrequisitos
Python 3.12 o superior
uv - Instalador y solucionador rápido de paquetes de Python
Configuración
Clonar el repositorio:
Cree un entorno virtual e instale:
Configuración
Variables de entorno
HUGGINGFACE_TOKEN: Su token de API de Hugging Face para acceder a conjuntos de datos privados
Integración de escritorio de Claude
Agregue lo siguiente a su archivo de configuración de Claude Desktop:
En Windows: %APPDATA%\Claude\claude_desktop_config.json
En MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
Licencia
Licencia MIT: consulte LICENCIA para obtener más detalles
Related MCP Servers
- AsecurityAlicenseAqualityUse HuggingFace Spaces directly from Claude. Use Open Source Image Generation, Chat, Vision tasks and more. Supports Image, Audio and text uploads/downloads.Last updated -3108367MIT License
- -securityAlicense-qualityAn unofficial MCP server that provides semantic search capabilities for Hugging Face models and datasets, enabling Claude and other MCP-compatible clients to search, discover, and explore the Hugging Face ecosystem using natural language queries.Last updated -19MIT License
- -security-license-qualityAn MCP server that provides Hugging Face Hub API and Search endpoints through multiple transport protocols (STDIO, SSE, StreamableHTTP, and StreamableHTTPJson), enabling integration with AI model capabilities.Last updated -140MIT License
- AsecurityAlicenseAqualityProvides tools to interact with the Dash documentation browser API, allowing users to list installed docsets, search across documentation, and enable full-text search.Last updated -379MIT License