Skip to main content
Glama

Dataset Viewer MCP Server

by privetin

データセットビューア MCP サーバー

Hugging Face Dataset Viewer APIと対話するための MCP サーバー。Hugging Face Hub でホストされているデータセットを参照および分析する機能を提供します。

特徴

リソース

  • Hugging Faceデータセットにアクセスするためにdataset:// URIスキームを使用します

  • データセットの構成と分割をサポート

  • データセットの内容へのページ区切りのアクセスを提供します

  • プライベートデータセットの認証を処理する

  • データセットの内容の検索とフィルタリングをサポート

  • データセットの統計と分析を提供します

ツール

サーバーは次のツールを提供します。

  1. 検証する

    • データセットが存在し、アクセス可能かどうかを確認する

    • パラメータ:

      • dataset : データセット識別子 (例: 'stanfordnlp/imdb')

      • auth_token (オプション): プライベートデータセットの場合

  2. 情報を取得する

    • データセットの詳細情報を取得する

    • パラメータ:

      • dataset : データセット識別子

      • auth_token (オプション): プライベートデータセットの場合

  3. 行を取得する

    • データセットのページ分割されたコンテンツを取得する

    • パラメータ:

      • dataset : データセット識別子

      • config : 設定名

      • split : 名前を分割

      • page (オプション): ページ番号 (0 から始まる)

      • auth_token (オプション): プライベートデータセットの場合

  4. 最初の行を取得する

    • データセット分割から最初の行を取得する

    • パラメータ:

      • dataset : データセット識別子

      • config : 設定名

      • split : 名前を分割

      • auth_token (オプション): プライベートデータセットの場合

  5. 統計情報を取得する

    • データセットの分割に関する統計情報を取得する

    • パラメータ:

      • dataset : データセット識別子

      • config : 設定名

      • split : 名前を分割

      • auth_token (オプション): プライベートデータセットの場合

  6. 検索データセット

    • データセット内のテキストを検索する

    • パラメータ:

      • dataset : データセット識別子

      • config : 設定名

      • split : 名前を分割

      • query : 検索するテキスト

      • auth_token (オプション): プライベートデータセットの場合

  7. フィルター

    • SQLのような条件を使用して行をフィルタリングする

    • パラメータ:

      • dataset : データセット識別子

      • config : 設定名

      • split : 名前を分割

      • where : SQL WHERE句(例:"score > 0.5")

      • orderby (オプション): SQL ORDER BY句

      • page (オプション): ページ番号 (0 から始まる)

      • auth_token (オプション): プライベートデータセットの場合

  8. get_parquet

    • データセット全体をParquet形式でダウンロードする

    • パラメータ:

      • dataset : データセット識別子

      • auth_token (オプション): プライベートデータセットの場合

インストール

前提条件

  • Python 3.12以上

  • uv - 高速な Python パッケージインストーラーとリゾルバー

設定

  1. リポジトリをクローンします。

git clone https://github.com/privetin/dataset-viewer.git cd dataset-viewer
  1. 仮想環境を作成してインストールします。

# Create virtual environment uv venv # Activate virtual environment # On Unix: source .venv/bin/activate # On Windows: .venv\Scripts\activate # Install in development mode uv add -e .

構成

環境変数

  • HUGGINGFACE_TOKEN : プライベートデータセットにアクセスするためのHugging Face APIトークン

クロードデスクトップ統合

Claude Desktop 構成ファイルに次の内容を追加します。

Windows の場合: %APPDATA%\Claude\claude_desktop_config.json

MacOSの場合: ~/Library/Application Support/Claude/claude_desktop_config.json

{ "mcpServers": { "dataset-viewer": { "command": "uv", "args": [ "--directory", "parent_to_repo/dataset-viewer", "run", "dataset-viewer" ] } } }

ライセンス

MITライセンス - 詳細はライセンスを参照

Related MCP Servers

  • A
    security
    A
    license
    A
    quality
    Use HuggingFace Spaces directly from Claude. Use Open Source Image Generation, Chat, Vision tasks and more. Supports Image, Audio and text uploads/downloads.
    Last updated -
    3
    108
    367
    MIT License
    • Apple
  • -
    security
    A
    license
    -
    quality
    An unofficial MCP server that provides semantic search capabilities for Hugging Face models and datasets, enabling Claude and other MCP-compatible clients to search, discover, and explore the Hugging Face ecosystem using natural language queries.
    Last updated -
    19
    MIT License
    • Apple
  • -
    security
    -
    license
    -
    quality
    An MCP server that provides Hugging Face Hub API and Search endpoints through multiple transport protocols (STDIO, SSE, StreamableHTTP, and StreamableHTTPJson), enabling integration with AI model capabilities.
    Last updated -
    140
    MIT License
  • A
    security
    A
    license
    A
    quality
    Provides tools to interact with the Dash documentation browser API, allowing users to list installed docsets, search across documentation, and enable full-text search.
    Last updated -
    3
    79
    MIT License
    • Apple

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/privetin/dataset-viewer'

If you have feedback or need assistance with the MCP directory API, please join our Discord server