Skip to main content
Glama

Dataset Viewer MCP Server

by privetin

数据集查看器 MCP 服务器

用于与Hugging Face 数据集查看器 API交互的 MCP 服务器,提供浏览和分析 Hugging Face Hub 上托管的数据集的功能。

特征

资源

  • 使用dataset:// URI 方案访问 Hugging Face 数据集

  • 支持数据集配置和分割

  • 提供对数据集内容的分页访问

  • 处理私有数据集的身份验证

  • 支持搜索和过滤数据集内容

  • 提供数据集统计和分析

工具

该服务器提供以下工具:

  1. 证实

    • 检查数据集是否存在且可访问

    • 参数:

      • dataset :数据集标识符(例如“stanfordnlp/imdb”)

      • auth_token (可选):用于私有数据集

  2. 获取信息

    • 获取有关数据集的详细信息

    • 参数:

      • dataset :数据集标识符

      • auth_token (可选):用于私有数据集

  3. 获取行

    • 获取数据集的分页内容

    • 参数:

      • dataset :数据集标识符

      • config :配置名称

      • split :拆分名称

      • page (可选):页码(从 0 开始)

      • auth_token (可选):用于私有数据集

  4. 获取第一行

    • 从数据集分割中获取第一行

    • 参数:

      • dataset :数据集标识符

      • config :配置名称

      • split :拆分名称

      • auth_token (可选):用于私有数据集

  5. 获取统计数据

    • 获取有关数据集拆分的统计信息

    • 参数:

      • dataset :数据集标识符

      • config :配置名称

      • split :拆分名称

      • auth_token (可选):用于私有数据集

  6. 搜索数据集

    • 在数据集中搜索文本

    • 参数:

      • dataset :数据集标识符

      • config :配置名称

      • split :拆分名称

      • query :要搜索的文本

      • auth_token (可选):用于私有数据集

  7. 筛选

    • 使用类似 SQL 的条件过滤行

    • 参数:

      • dataset :数据集标识符

      • config :配置名称

      • split :拆分名称

      • where :SQL WHERE 子句(例如“score > 0.5”)

      • orderby (可选):SQL ORDER BY 子句

      • page (可选):页码(从 0 开始)

      • auth_token (可选):用于私有数据集

  8. 获取镶木地板

    • 以 Parquet 格式下载整个数据集

    • 参数:

      • dataset :数据集标识符

      • auth_token (可选):用于私有数据集

安装

先决条件

  • Python 3.12 或更高版本

  • uv - 快速 Python 软件包安装程序和解析器

设置

  1. 克隆存储库:

git clone https://github.com/privetin/dataset-viewer.git cd dataset-viewer
  1. 创建虚拟环境并安装:

# Create virtual environment uv venv # Activate virtual environment # On Unix: source .venv/bin/activate # On Windows: .venv\Scripts\activate # Install in development mode uv add -e .

配置

环境变量

  • HUGGINGFACE_TOKEN :用于访问私有数据集的 Hugging Face API 令牌

Claude 桌面集成

将以下内容添加到您的 Claude Desktop 配置文件:

在 Windows 上: %APPDATA%\Claude\claude_desktop_config.json

在 MacOS 上: ~/Library/Application Support/Claude/claude_desktop_config.json

{ "mcpServers": { "dataset-viewer": { "command": "uv", "args": [ "--directory", "parent_to_repo/dataset-viewer", "run", "dataset-viewer" ] } } }

执照

MIT 许可证 - 详情请参阅许可证

Related MCP Servers

  • A
    security
    A
    license
    A
    quality
    Use HuggingFace Spaces directly from Claude. Use Open Source Image Generation, Chat, Vision tasks and more. Supports Image, Audio and text uploads/downloads.
    Last updated -
    3
    108
    367
    MIT License
    • Apple
  • -
    security
    A
    license
    -
    quality
    An unofficial MCP server that provides semantic search capabilities for Hugging Face models and datasets, enabling Claude and other MCP-compatible clients to search, discover, and explore the Hugging Face ecosystem using natural language queries.
    Last updated -
    19
    MIT License
    • Apple
  • -
    security
    -
    license
    -
    quality
    An MCP server that provides Hugging Face Hub API and Search endpoints through multiple transport protocols (STDIO, SSE, StreamableHTTP, and StreamableHTTPJson), enabling integration with AI model capabilities.
    Last updated -
    140
    MIT License
  • A
    security
    A
    license
    A
    quality
    Provides tools to interact with the Dash documentation browser API, allowing users to list installed docsets, search across documentation, and enable full-text search.
    Last updated -
    3
    79
    MIT License
    • Apple

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/privetin/dataset-viewer'

If you have feedback or need assistance with the MCP directory API, please join our Discord server