Skip to main content
Glama
privetin

Dataset Viewer MCP Server

by privetin

Servidor MCP del visor de conjuntos de datos

Un servidor MCP para interactuar con la API del visualizador de conjuntos de datos de Hugging Face , que proporciona capacidades para explorar y analizar conjuntos de datos alojados en Hugging Face Hub.

Características

Recursos

  • Utiliza el esquema URI dataset:// para acceder a los conjuntos de datos de Hugging Face

  • Admite configuraciones y divisiones de conjuntos de datos

  • Proporciona acceso paginado al contenido del conjunto de datos

  • Maneja la autenticación para conjuntos de datos privados

  • Admite la búsqueda y el filtrado de contenidos de conjuntos de datos.

  • Proporciona estadísticas y análisis de conjuntos de datos.

Herramientas

El servidor proporciona las siguientes herramientas:

  1. validar

    • Comprobar si un conjunto de datos existe y es accesible

    • Parámetros:

      • dataset : identificador del conjunto de datos (por ejemplo, 'stanfordnlp/imdb')

      • auth_token (opcional): para conjuntos de datos privados

  2. obtener_información

    • Obtenga información detallada sobre un conjunto de datos

    • Parámetros:

      • dataset : identificador del conjunto de datos

      • auth_token (opcional): para conjuntos de datos privados

  3. obtener_filas

    • Obtener el contenido paginado de un conjunto de datos

    • Parámetros:

      • dataset : identificador del conjunto de datos

      • config : Nombre de la configuración

      • split : Dividir nombre

      • page (opcional): Número de página (basado en 0)

      • auth_token (opcional): para conjuntos de datos privados

  4. obtener_primeras_filas

    • Obtener las primeras filas de una división del conjunto de datos

    • Parámetros:

      • dataset : identificador del conjunto de datos

      • config : Nombre de la configuración

      • split : Dividir nombre

      • auth_token (opcional): para conjuntos de datos privados

  5. obtener_estadísticas

    • Obtener estadísticas sobre una división del conjunto de datos

    • Parámetros:

      • dataset : identificador del conjunto de datos

      • config : Nombre de la configuración

      • split : Dividir nombre

      • auth_token (opcional): para conjuntos de datos privados

  6. conjunto de datos de búsqueda

    • Buscar texto dentro de un conjunto de datos

    • Parámetros:

      • dataset : identificador del conjunto de datos

      • config : Nombre de la configuración

      • split : Dividir nombre

      • query : Texto a buscar

      • auth_token (opcional): para conjuntos de datos privados

  7. filtrar

    • Filtrar filas usando condiciones similares a SQL

    • Parámetros:

      • dataset : identificador del conjunto de datos

      • config : Nombre de la configuración

      • split : Dividir nombre

      • where : cláusula WHERE de SQL (por ejemplo, "puntuación > 0,5")

      • orderby (opcional): cláusula ORDER BY de SQL

      • page (opcional): Número de página (basado en 0)

      • auth_token (opcional): para conjuntos de datos privados

  8. obtener_parquet

    • Descargar el conjunto de datos completo en formato Parquet

    • Parámetros:

      • dataset : identificador del conjunto de datos

      • auth_token (opcional): para conjuntos de datos privados

Related MCP server: Hugging Face Hub Semantic Search MCP

Instalación

Prerrequisitos

  • Python 3.12 o superior

  • uv - Instalador y solucionador rápido de paquetes de Python

Configuración

  1. Clonar el repositorio:

git clone https://github.com/privetin/dataset-viewer.git cd dataset-viewer
  1. Cree un entorno virtual e instale:

# Create virtual environment uv venv # Activate virtual environment # On Unix: source .venv/bin/activate # On Windows: .venv\Scripts\activate # Install in development mode uv add -e .

Configuración

Variables de entorno

  • HUGGINGFACE_TOKEN : Su token de API de Hugging Face para acceder a conjuntos de datos privados

Integración de escritorio de Claude

Agregue lo siguiente a su archivo de configuración de Claude Desktop:

En Windows: %APPDATA%\Claude\claude_desktop_config.json

En MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json

{ "mcpServers": { "dataset-viewer": { "command": "uv", "args": [ "--directory", "parent_to_repo/dataset-viewer", "run", "dataset-viewer" ] } } }

Licencia

Licencia MIT: consulte LICENCIA para obtener más detalles

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/privetin/dataset-viewer'

If you have feedback or need assistance with the MCP directory API, please join our Discord server