Servidor MCP del visor de conjuntos de datos
Un servidor MCP para interactuar con la API del visualizador de conjuntos de datos de Hugging Face , que proporciona capacidades para explorar y analizar conjuntos de datos alojados en Hugging Face Hub.
Características
Recursos
Utiliza el esquema URI
dataset://para acceder a los conjuntos de datos de Hugging FaceAdmite configuraciones y divisiones de conjuntos de datos
Proporciona acceso paginado al contenido del conjunto de datos
Maneja la autenticación para conjuntos de datos privados
Admite la búsqueda y el filtrado de contenidos de conjuntos de datos.
Proporciona estadísticas y análisis de conjuntos de datos.
Herramientas
El servidor proporciona las siguientes herramientas:
validar
Comprobar si un conjunto de datos existe y es accesible
Parámetros:
dataset: identificador del conjunto de datos (por ejemplo, 'stanfordnlp/imdb')auth_token(opcional): para conjuntos de datos privados
obtener_información
Obtenga información detallada sobre un conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosauth_token(opcional): para conjuntos de datos privados
obtener_filas
Obtener el contenido paginado de un conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombrepage(opcional): Número de página (basado en 0)auth_token(opcional): para conjuntos de datos privados
obtener_primeras_filas
Obtener las primeras filas de una división del conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombreauth_token(opcional): para conjuntos de datos privados
obtener_estadísticas
Obtener estadísticas sobre una división del conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombreauth_token(opcional): para conjuntos de datos privados
conjunto de datos de búsqueda
Buscar texto dentro de un conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombrequery: Texto a buscarauth_token(opcional): para conjuntos de datos privados
filtrar
Filtrar filas usando condiciones similares a SQL
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombrewhere: cláusula WHERE de SQL (por ejemplo, "puntuación > 0,5")orderby(opcional): cláusula ORDER BY de SQLpage(opcional): Número de página (basado en 0)auth_token(opcional): para conjuntos de datos privados
obtener_parquet
Descargar el conjunto de datos completo en formato Parquet
Parámetros:
dataset: identificador del conjunto de datosauth_token(opcional): para conjuntos de datos privados
Related MCP server: Hugging Face Hub Semantic Search MCP
Instalación
Prerrequisitos
Python 3.12 o superior
uv - Instalador y solucionador rápido de paquetes de Python
Configuración
Clonar el repositorio:
Cree un entorno virtual e instale:
Configuración
Variables de entorno
HUGGINGFACE_TOKEN: Su token de API de Hugging Face para acceder a conjuntos de datos privados
Integración de escritorio de Claude
Agregue lo siguiente a su archivo de configuración de Claude Desktop:
En Windows: %APPDATA%\Claude\claude_desktop_config.json
En MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
Licencia
Licencia MIT: consulte LICENCIA para obtener más detalles