Servidor MCP del visor de conjuntos de datos
Un servidor MCP para interactuar con la API del visualizador de conjuntos de datos de Hugging Face , que proporciona capacidades para explorar y analizar conjuntos de datos alojados en Hugging Face Hub.
Características
Recursos
Utiliza el esquema URI
dataset://para acceder a los conjuntos de datos de Hugging FaceAdmite configuraciones y divisiones de conjuntos de datos
Proporciona acceso paginado al contenido del conjunto de datos
Maneja la autenticación para conjuntos de datos privados
Admite la búsqueda y el filtrado de contenidos de conjuntos de datos.
Proporciona estadísticas y análisis de conjuntos de datos.
Herramientas
El servidor proporciona las siguientes herramientas:
validar
Comprobar si un conjunto de datos existe y es accesible
Parámetros:
dataset: identificador del conjunto de datos (por ejemplo, 'stanfordnlp/imdb')auth_token(opcional): para conjuntos de datos privados
obtener_información
Obtenga información detallada sobre un conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosauth_token(opcional): para conjuntos de datos privados
obtener_filas
Obtener el contenido paginado de un conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombrepage(opcional): Número de página (basado en 0)auth_token(opcional): para conjuntos de datos privados
obtener_primeras_filas
Obtener las primeras filas de una división del conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombreauth_token(opcional): para conjuntos de datos privados
obtener_estadísticas
Obtener estadísticas sobre una división del conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombreauth_token(opcional): para conjuntos de datos privados
conjunto de datos de búsqueda
Buscar texto dentro de un conjunto de datos
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombrequery: Texto a buscarauth_token(opcional): para conjuntos de datos privados
filtrar
Filtrar filas usando condiciones similares a SQL
Parámetros:
dataset: identificador del conjunto de datosconfig: Nombre de la configuraciónsplit: Dividir nombrewhere: cláusula WHERE de SQL (por ejemplo, "puntuación > 0,5")orderby(opcional): cláusula ORDER BY de SQLpage(opcional): Número de página (basado en 0)auth_token(opcional): para conjuntos de datos privados
obtener_parquet
Descargar el conjunto de datos completo en formato Parquet
Parámetros:
dataset: identificador del conjunto de datosauth_token(opcional): para conjuntos de datos privados
Related MCP server: Hugging Face Hub Semantic Search MCP
Instalación
Prerrequisitos
Python 3.12 o superior
uv - Instalador y solucionador rápido de paquetes de Python
Configuración
Clonar el repositorio:
git clone https://github.com/privetin/dataset-viewer.git
cd dataset-viewerCree un entorno virtual e instale:
# Create virtual environment
uv venv
# Activate virtual environment
# On Unix:
source .venv/bin/activate
# On Windows:
.venv\Scripts\activate
# Install in development mode
uv add -e .Configuración
Variables de entorno
HUGGINGFACE_TOKEN: Su token de API de Hugging Face para acceder a conjuntos de datos privados
Integración de escritorio de Claude
Agregue lo siguiente a su archivo de configuración de Claude Desktop:
En Windows: %APPDATA%\Claude\claude_desktop_config.json
En MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
{
"mcpServers": {
"dataset-viewer": {
"command": "uv",
"args": [
"--directory",
"parent_to_repo/dataset-viewer",
"run",
"dataset-viewer"
]
}
}
}Licencia
Licencia MIT: consulte LICENCIA para obtener más detalles