Skip to main content
Glama
mobus-ai

MobusMCP

Official

Mobus

面向 AI 助手的搜索数据集工具 在单次对话中发现、预览和分析来自 20 个平台的数据集。

License: MIT Node.js MCP TypeScript


连接到 Claude

在一分钟内将 Mobus 添加到 Claude。无需安装,无需 API 密钥,无需运行任何程序。

  1. 打开 claude.ai (或 Claude 桌面版 / 移动版)

  2. 从左下角进入 Settings (设置) → Connectors (连接器)

  3. 点击 Add custom connector (添加自定义连接器)

  4. 命名为 Mobus 并粘贴此 URL:

https://mobus-production.up.railway.app/mcp
  1. 开始新的对话并尝试:

"搜索具有商业许可的空气质量数据集"

就是这样。所有 15 个工具均可立即使用。



功能介绍

只需询问你的 AI 助手。

"搜索具有商业许可的空气质量数据集" "预览该 Zenodo 数据集的前 20 行" "查找提及气候风险的 SEC 文件" "为该 Hugging Face 数据集生成 APA 引用" "检查该数据集是否可用于商业用途" "可视化该数据集"

Mobus 会将请求并行分发到每个已配置的平台,检查许可、预览数据、生成引用并追踪学术渊源——如果缺少 API 密钥,它会优雅地处理失败。


工具

发现

  • search_datasets — 同时搜索所有 20 个平台

  • find_research_datasets — 论文中引用的数据集

  • find_similar — 与你现有数据集相似的数据集

评估

  • get_dataset_details — 完整元数据

  • preview_dataset — 前 N 行数据

  • compare_datasets — 并排比较 2-5 个数据集

质量与合规性

  • assess_quality — 缺失值、重复项、统计信息

  • check_license — 商业/学术/内部许可检查

  • check_compatibility — 与你的架构匹配度检查

引用与输出

  • generate_citation — APA, BibTeX, Chicago 格式

  • visualize_dataset (仅限本地运行 - 请让 Claude 生成 artifact) — 交互式 ECharts 仪表板

  • watch_query — 监控新数据集

高级研究

  • get_dataset_provenance — 介绍论文及历史

  • get_dataset_lineage — 变体及衍生品

  • trace_citation_graph — 引用链分析


支持的平台

无需认证

  • data.gov

  • Zenodo

  • OpenML

  • UCI ML Repository

  • AWS Open Data

  • World Bank

  • WHO GHO

  • NASA Earthdata

  • Eurostat

  • arXiv

  • Census.gov

  • SEC EDGAR

  • Crossref

可选认证

  • Hugging Face (使用 token 更快)

  • Socrata (使用 token 更快)

  • Semantic Scholar

需要密钥

  • Kaggle

  • Google Dataset Search

功能受限

  • Papers with Code (API 已关闭)

  • Econdb (现需密钥)

缺失密钥会自动跳过该平台。服务器绝不会崩溃。


本地运行 (可选)

如果你更喜欢自托管而不是使用上述托管版本:

git clone https://github.com/hrantvirabyan/Mobus.git
cd Mobus
npm install
cp .env.example .env   # fill in any keys you have (all optional)
npm run build

Cursor

添加到 ~/.cursor/mcp.json

{
  "mcpServers": {
    "mobus": {
      "command": "node",
      "args": ["/absolute/path/to/Mobus/dist/main.js"]
    }
  }
}

重启 Cursor。所有 15 个工具将出现在聊天中。

Claude 桌面版

配置格式相同,位于 ~/Library/Application Support/Claude/claude_desktop_config.json (macOS) 或 %APPDATA%\Claude\claude_desktop_config.json (Windows)。

API 密钥 (均为可选)

变量

用于

获取地址

KAGGLE_USERNAME / KAGGLE_KEY

Kaggle

kaggle.com/account → API

HF_TOKEN

Hugging Face

huggingface.co/settings/tokens

GOOGLE_API_KEY / GOOGLE_CSE_ID

Google

console.cloud.google.com

SOCRATA_APP_TOKEN

Socrata

dev.socrata.com/register


工具参考

search_datasets

参数

类型

默认值

描述

query

string

必填

搜索查询

sources

string[]

全部

包含的平台

limit

number

5

每个来源的结果数 (最大 20)

license

string

例如 cc-by-4.0

format

string

例如 csv, parquet

updated_after

string

ISO 日期

modality

string

例如 tabular, image

get_dataset_details

参数

类型

描述

source

string

平台

dataset_id

string

数据集 ID

preview_dataset

参数

类型

默认值

描述

source / dataset_id

string

必填

rows

number

10

最大 100

visualize_dataset (仅限本地运行 - 请让 Claude 生成 artifact)

生成一个交互式 ECharts 仪表板,包含列选择器、过滤器构建器、行范围选择器、9 种图表类型、可排序表格以及 PNG/SVG/CSV/JSON 导出功能。

参数

类型

默认值

描述

source / dataset_id

string

必填

rows

number

200

最大 500

open

boolean

true

自动打开浏览器

compare_datasets

参数

类型

描述

datasets

array

2-5 个 {source, dataset_id} 对象

check_compatibility

参数

类型

描述

source / dataset_id

string

schema

array

[{name, type?}]

find_similar

参数

类型

默认值

描述

source / dataset_id

string

必填

limit

number

5

最大 20

generate_citation

参数

类型

默认值

描述

source / dataset_id

string

必填

format

string

apa

bibtex, apa, chicago

assess_quality

参数

类型

默认值

描述

source / dataset_id

string

必填

sample_rows

number

100

最大 500

check_license

参数

类型

描述

source / dataset_id

string

use_case

string

commercial / academic / internal / redistribution

watch_query

参数

类型

描述

action

string

add / remove / list / check

query / sources / watch_id

参见 action

find_research_datasets

参数

类型

默认值

描述

query

string

必填

研究主题

limit

number

10

最大 20

semantic

boolean

false

SPECTER v2 嵌入

get_dataset_provenance / trace_citation_graph / get_dataset_lineage

目前功能受限 — 依赖于已关闭的 Papers with Code API。


已知问题

  • Papers with Code API 在被 HuggingFace 收购后关闭 — 溯源/来源/引用图工具会返回错误

  • Econdb 现在需要密钥 — 在添加支持前返回空结果

  • arXiv 在高并发并行负载下会触发速率限制 (适配器使用 3 秒节流)


贡献

请参阅 CONTRIBUTING.md。如果 Mobus 节省了你的时间,给 GitHub 加个星标可以帮助其他人发现它。

许可

MIT — 参见 LICENSE

A
license - permissive license
-
quality - not tested
C
maintenance

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/mobus-ai/Mobus'

If you have feedback or need assistance with the MCP directory API, please join our Discord server