Which integrations are available for this server?

Enables AI agents to discover and capture API endpoints from Xiaohongshu, providing tools to inspect requests, responses, and extract structured data from the platform.

How do I use web-scout?

1. Click on "Install Server". 2. Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state. 3. In the chat, type @ followed by the MCP server name and your instructions, e.g., "@web-scout Open xiaohongshu.com explore page and list APIs" That's it! The server will respond to your query, and you can continue using it as needed. Here is a step-by-step guide with screenshots.

web-scout

by SanZiNEO

Overview Schema Related Servers Score Discussions

Python

Local

Web Scout

免责声明: 本项目仅用于学习、研究和技术交流。使用者应遵守目标网站的 robots.txt 和服务条款，自行承担所有法律责任。项目作者不鼓励、不参与任何违反法律法规的使用行为。

帮助 AI 发现网页数据源的 MCP 服务器——不是爬虫，而是让 AI 知道"数据在哪、长什么样"的侦察工具。

License: MIT Python

English README

定位

Web Scout 是一个发现工具，不是爬虫。

✅ 做的	❌ 不做的
Network 面板 → JSON API 端点	XHR 断点追踪调用链
DOM → 重复结构 + CSS 选择器	JS 加密 / wasm 逆向
请求参数 + 响应结构提取	WebSocket 二进制帧解码
页面全文 → Markdown 给 AI 阅读	E2EE 解密
压缩字段文档 → AI 据此写爬虫	自动生成可运行的爬虫代码

适用于标准 HTTP JSON API 站点。不适用于加密数据流、wasm 混淆等逆向场景。

Related MCP server: ApiTap

原理

网站 → 浏览器 → 全文 Markdown
       ↓           ↓
  网络监听     AI 阅读文本 → 选关键词
       ↓           ↓
  API 捕获     搜索 → 匹配含关键词的 API
       ↓               ↓
  字段文档 ←──────────┘
  原始数据包保存到本地

快速开始

git clone https://github.com/SanZiNEO/web-scout.git
cd web-scout
python -m venv .venv
.venv\Scripts\activate        # Windows
pip install -e .

MCP 配置

在 kilo.json 中添加：

"web-scout": {
    "type": "local",
    "command": ["path\\to\\web-scout\\.venv\\Scripts\\web-scout.exe"],
    "enabled": true
}

可选环境变量：

变量	默认值	说明
`HEADLESS`	`"false"`	无头模式（`"true"` 不显示浏览器窗口）
`BROWSER_PATH`	自动	浏览器路径，`"edge"` 使用 Edge
`BROWSER_ADDRESS`	无	连接已有浏览器（如 `127.0.0.1:9222`），设置后忽略 HEADLESS/BROWSER_PATH
`MULTI_BROWSER`	`"false"`	`"true"` 时尝试多个调试端口（9222-9231），避免端口冲突
`USER_DATA_DIR`	临时	持久化用户文件夹，保留登录态
`LOGIN_TIMEOUT`	`"300"`	登录最大等待秒数
`MAX_TEXT_LENGTH`	`"3000"`	scout_open 页面文本最大字符数
`RESPONSE_DIR`	`"./response"`	数据导出默认目录，可用 `output_dir` 参数覆盖

工具（21 个）

导航（6 个）

工具	说明
`scout_open`	启动/接管 Chromium，清空旧标签页。不导航
`scout_goto`	导航到 URL，监听 API，返回页面文本 + 元素 + API 摘要。支持 `new_tab` 参数
`scout_close`	关闭整个浏览器，清空所有数据
`scout_tabs`	列出所有标签页，标注当前活跃
`scout_tab_switch`	切换到指定标签页（短 ID 前缀匹配）
`scout_tab_close`	关闭指定标签页，清理其 API 记录。支持逗号分隔批量关闭

观察（4 个）

工具	说明
`scout_fetch`	滚动到底 → 全量 innerText + AXTree 链接 → 缓存文件 → 分段读取
`scout_screenshot`	截取当前页面（可视区域或整页）
`scout_elements`	可交互元素 + DOM 容器 v3 + Common Actions
`scout_cookies`	查看 cookie（当前域或全部，摘要或完整信息）。指定 tab 获取对应标签页

交互（2 个）

工具	说明
`scout_act`	链式操作（input/scroll/click/select），每步报告新增 API method + path
`scout_login`	等待用户在浏览器中手动登录，通过 cookie 变化检测

发现（8 个）

工具	说明
`scout_apis`	列出所有捕获的 API 端点，支持关键词和 tab 过滤
`scout_inspect`	查看 API 的完整请求/响应，支持逗号分隔多 ID
`scout_search`	全局搜索：API 响应体 → 页面源码 → DOM，支持逗号分隔多关键词
`scout_context`	搜索关键词返回精确字段路径 + 采样值，支持逗号分隔多关键词
`scout_export`	导出 API：字段文档 + 原始 JSON，支持逗号分隔多 ID，`output_dir` 指定目录
`scout_export_all`	批量导出所有已捕获的 API
`scout_peek`	打开页面 → 监听 → 按路径匹配 API → 一步返回详情
`scout_request`	重放 HTTP 请求（复用捕获参数或自定义），自动同步浏览器 cookie

扫描（1 个）

工具	说明
`scout_scan`	`mode="all"` 全量扫描（API + SSR + DOM）。`mode="dom"` 关键词扫描

架构

src/web_scout/
├── server.py           # FastMCP 入口 + 21 个工具
├── state.py            # 全局状态 + _api_pool + _dom_scanners
├── browser.py          # Chromium 封装 + CDP tab_id 管理 + 前缀匹配
├── network_pool.py     # API 公共池 + 按 tab_id 过滤 + 字段压缩
├── requester.py        # SessionPage 请求执行器 + cookie 同步
├── dom.py              # 元素扫描 + 容器发现 v3 + Common Actions
├── export.py           # 压缩字段文档 + 原始数据包保存
├── login.py            # cookie 变化检测登录 + 手动登录等待
└── tools/
    ├── navigate.py     # 导航: open goto close tabs tab_switch tab_close
    ├── observe.py      # 观察: fetch screenshot elements cookies
    ├── act.py          # 交互: act login
    ├── discover.py     # 发现: apis inspect search context export export_all peek request
    └── scan.py         # 扫描: scan

License

MIT © ShanZhi

免责声明
本项目（Web Scout）是一个通用的网页数据源发现工具，本身不发起爬取请求，不存储、不传输任何网站数据。使用者应：
遵守目标网站的 robots.txt 和服务条款（Terms of Service）
控制请求频率，不对目标网站造成异常负载
仅抓取公开数据，不绕过网站的认证和授权机制
自行承担使用本工具所产生的全部法律责任
项目作者（ShanZhi / SanZiNEO）不鼓励、不参与任何违反法律法规或网站条款的使用行为。本工具仅用于学习、研究和技术交流目的。

声明： 本项目由 AI 辅助开发，目标是帮助 AI 和开发者快速发现网页数据源，不包含任何破解、绕过或恶意功能。用户应遵守目标网站的 robots.txt 及相关法律法规。

Install Server

license - permissive license

quality

maintenance

How are these scores calculated?

Maintenance

–Maintainers

–Response time

–Release cycle

–Releases (12mo)

Commit activity

Resources

GitHub Repository

Need Help?

Related Servers

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Tools

View all tools

Latest Blog Posts

Your AI Chatbot Just Exposed Your CEO's Salary to an Intern
By Om-Shree-0709 on July 2, 2026.
Agent Identity
MCP Security
OAuth Delegation
Why MCP Servers Need Execution Sandboxing (And Why Your Current Stack Isn't Enough)
By Om-Shree-0709 on June 30, 2026.
Agentic Ai
Prompt Injection
WebAssembly
Lightport: Open-Sourcing Glama's AI Gateway
By punkpeye on April 27, 2026.
OpenAI
open source

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/SanZiNEO/web-scout'

If you have feedback or need assistance with the MCP directory API, please join our Discord server