Skip to main content
Glama

Thordata MCP Server

Licence


📖 概述

ScraperMCP 服务器无缝桥接AI与Web生态,一键触达全球任意网站,实时渲染JavaScript、智能突破反爬机制,输出AI就绪的结构化数据内容。

🛠️ MCP 工具

Thordata MCP 支持解锁器和普通代理双通道数据获取,全面兼容MarkDown、HTML、Links多种数据格式

Web 爬虫 API 工具

Thordata MCP 提供 parse_with_ai_selectors 工具,依托 Thordata Web Scraper API 实现任意网站智能抓取

✅ 先决条件

开始部署前,请确保具备:

  • thordata Web 爬虫 API 账户: 访问 thordata 获取专属账号凭证;

📦 配置

环境变量

thordata MCP 服务器支持以下环境变量配置:

名称

描述

默认值

UNLOCKER_PROXY_LOGIN

解锁器用户名

UNLOCKER_PROXY_PASSWORD

解锁器密码

UNLOCKER_PROXY_URL

解锁器代理地址

DEFAULT_PROXY_LOGIN

普通代理用户名

DEFAULT_PROXY_PASSWORD

普通代理密码

DEFAULT_PROXY_URL

普通代理地址

使用 uv 配置

  • 安装 uv 包管理器:

    # macOS 和 Linux curl -LsSf https://astral.sh/uv/install.sh | sh

    或者:

    # Windows powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
  • 使用以下配置:

    { "mcpServers": { "Scraper": { "command": "uv", "args": [ "--directory", "<文件夹绝对路径>",#例如 D:\\ScraperMcp "run", "Scraper.py" ] } }

}

### 启动命令 ### fastmcp run Scraper.py:mcp ### 🖥️ 手动设置指南 #### Claude Desktop 配置 1. 打开 Claude 应用 2. 导航至 **设置 → 开发者 → 编辑配置** 3. 将上述配置添加到 `claude_desktop_config.json` 文件中 #### Cursor AI 配置 1. 打开 Cursor 编辑器 2. 导航至 **设置 → Cursor 设置 → MCP** 3. 点击 **添加新的全局 MCP 服务器** 4. 配置相应参数 #### Cline 配置 1. 打开 Cline 设置 2. 导航至 **MCP服务器设置 → 已安装** 3. 点击 **配置MCP服务器** 4. 配置相应参数 ### 手动设置 Cline 设置 → Mcp服务器 设置 -> 已安装 -> 点击配置MCP服务器 并配置相应参数 ## 🛡️ 许可证 基于 MIT 许可证开源分发 - 详见 [LICENSE](LICENSE) 文件。 --- ## 关于 Thordata Thordata 作为市场领先的网络情报采集平台,恪守最高商业道德与合规标准,赋能全球企业挖掘数据驱动的商业洞察。 <div align="center"> <sub> 由 <a href="https://www.thordata.com/">Thordata</a> 由Thordata制作,若 MCP 为您节省宝贵时间,诚邀给予 ⭐ 支持。 </sub> </div> ## ✨ 核心特性 <details> <summary><strong> 全域网站内容抓取</strong></summary> <br> - 支持任意URL数据提取,包括复杂单页应用程序 - 完整JavaScript渲染能力,确保动态内容完美呈现 - 灵活渲染模式选择:全JS渲染、纯HTML或无渲染 </details> <details> <summary><strong> 智能AI数据预处理</strong></summary> <br> - 自动化HTML清洗并转换为高可读性Markdown - 智能提取有效可用链接,优化数据结构 - 原生HTML格式支持,保持数据完整性 </details> <details> <summary><strong> 全球网络无障碍访问</strong></summary> <br> - 高效突破复杂反爬虫防护系统 - 稳定抓取高难度网站内容 - 195+国家IP池自动轮换,打破地理限制 </details> <details> <summary><strong> 跨平台灵活部署</strong></summary> <br> - 自定义渲染与解析参数配置 - 无缝对接AI模型与分析工具 - 全面支持macOS、Windows、Linux系统 </details> --- ## 为什么选择 Thordata MCP?&nbsp;🕸️ ➜ 📦 ➜ 🤖 只需对LLM说*"总结Hacker News上关于Mcp的最新讨论"*,即刻获得精准答案。 MCP(多客户端代理)为您代劳所有繁琐环节: | Thordata MCP 的核心价值 | 为您带来的优势 | |-------------------------------------------------------------------|------------------------------------------| | **Thordata全球代理网络智能绕过反机器人检测** | 保障访问畅通与身份匿名 | | **一键式数据获取解决方案** | 复杂单页应用轻松应对 | | **多格式输出支持(MarkDown/HTML/Links)** | 精准匹配您的数据需求
-
security - not tested
A
license - permissive license
-
quality - not tested

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Enables AI models to scrape and extract data from any website globally using Thordata's 195+ country proxy network. Bypasses anti-bot systems and renders JavaScript content, outputting structured data in Markdown, HTML, or Links format.

  1. 🛠️ MCP 工具
    1. Web 爬虫 API 工具
  2. ✅ 先决条件
    1. 📦 配置
      1. 环境变量
      2. 使用 uv 配置

    MCP directory API

    We provide all the information about MCP servers via our MCP API.

    curl -X GET 'https://glama.ai/api/mcp/v1/servers/xja1023789-collab/ScraperMcpCeshi'

    If you have feedback or need assistance with the MCP directory API, please join our Discord server