Skip to main content
Glama
privetin

Dataset Viewer MCP Server

by privetin

データセットビューア MCP サーバー

Hugging Face Dataset Viewer APIと対話するための MCP サーバー。Hugging Face Hub でホストされているデータセットを参照および分析する機能を提供します。

特徴

リソース

  • Hugging Faceデータセットにアクセスするためにdataset:// URIスキームを使用します

  • データセットの構成と分割をサポート

  • データセットの内容へのページ区切りのアクセスを提供します

  • プライベートデータセットの認証を処理する

  • データセットの内容の検索とフィルタリングをサポート

  • データセットの統計と分析を提供します

ツール

サーバーは次のツールを提供します。

  1. 検証する

    • データセットが存在し、アクセス可能かどうかを確認する

    • パラメータ:

      • dataset : データセット識別子 (例: 'stanfordnlp/imdb')

      • auth_token (オプション): プライベートデータセットの場合

  2. 情報を取得する

    • データセットの詳細情報を取得する

    • パラメータ:

      • dataset : データセット識別子

      • auth_token (オプション): プライベートデータセットの場合

  3. 行を取得する

    • データセットのページ分割されたコンテンツを取得する

    • パラメータ:

      • dataset : データセット識別子

      • config : 設定名

      • split : 名前を分割

      • page (オプション): ページ番号 (0 から始まる)

      • auth_token (オプション): プライベートデータセットの場合

  4. 最初の行を取得する

    • データセット分割から最初の行を取得する

    • パラメータ:

      • dataset : データセット識別子

      • config : 設定名

      • split : 名前を分割

      • auth_token (オプション): プライベートデータセットの場合

  5. 統計情報を取得する

    • データセットの分割に関する統計情報を取得する

    • パラメータ:

      • dataset : データセット識別子

      • config : 設定名

      • split : 名前を分割

      • auth_token (オプション): プライベートデータセットの場合

  6. 検索データセット

    • データセット内のテキストを検索する

    • パラメータ:

      • dataset : データセット識別子

      • config : 設定名

      • split : 名前を分割

      • query : 検索するテキスト

      • auth_token (オプション): プライベートデータセットの場合

  7. フィルター

    • SQLのような条件を使用して行をフィルタリングする

    • パラメータ:

      • dataset : データセット識別子

      • config : 設定名

      • split : 名前を分割

      • where : SQL WHERE句(例:"score > 0.5")

      • orderby (オプション): SQL ORDER BY句

      • page (オプション): ページ番号 (0 から始まる)

      • auth_token (オプション): プライベートデータセットの場合

  8. get_parquet

    • データセット全体をParquet形式でダウンロードする

    • パラメータ:

      • dataset : データセット識別子

      • auth_token (オプション): プライベートデータセットの場合

Related MCP server: Hugging Face Hub Semantic Search MCP

インストール

前提条件

  • Python 3.12以上

  • uv - 高速な Python パッケージインストーラーとリゾルバー

設定

  1. リポジトリをクローンします。

git clone https://github.com/privetin/dataset-viewer.git
cd dataset-viewer
  1. 仮想環境を作成してインストールします。

# Create virtual environment
uv venv

# Activate virtual environment
# On Unix:
source .venv/bin/activate
# On Windows:
.venv\Scripts\activate

# Install in development mode
uv add -e .

構成

環境変数

  • HUGGINGFACE_TOKEN : プライベートデータセットにアクセスするためのHugging Face APIトークン

クロードデスクトップ統合

Claude Desktop 構成ファイルに次の内容を追加します。

Windows の場合: %APPDATA%\Claude\claude_desktop_config.json

MacOSの場合: ~/Library/Application Support/Claude/claude_desktop_config.json

{
  "mcpServers": {
    "dataset-viewer": {
      "command": "uv",
      "args": [
        "--directory",
        "parent_to_repo/dataset-viewer",
        "run",
        "dataset-viewer"
      ]
    }
  }
}

ライセンス

MITライセンス - 詳細はライセンスを参照

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/privetin/dataset-viewer'

If you have feedback or need assistance with the MCP directory API, please join our Discord server