web-scout
Enables AI agents to discover and capture API endpoints from Xiaohongshu, providing tools to inspect requests, responses, and extract structured data from the platform.
Click on "Install Server".
Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state.
In the chat, type
@followed by the MCP server name and your instructions, e.g., "@web-scoutOpen xiaohongshu.com explore page and list APIs"
That's it! The server will respond to your query, and you can continue using it as needed.
Here is a step-by-step guide with screenshots.
Web Scout
免责声明: 本项目仅用于学习、研究和技术交流。使用者应遵守目标网站的
robots.txt和服务条款,自行承担所有法律责任。项目作者不鼓励、不参与任何违反法律法规的使用行为。
帮助 AI 发现网页数据源的 MCP 服务器——不是爬虫,而是让 AI 知道"数据在哪、长什么样"的侦察工具。
定位
Web Scout 是一个发现工具,不是爬虫。
✅ 做的 | ❌ 不做的 |
Network 面板 → JSON API 端点 | XHR 断点追踪调用链 |
DOM → 重复结构 + CSS 选择器 | JS 加密 / wasm 逆向 |
请求参数 + 响应结构提取 | WebSocket 二进制帧解码 |
页面全文 → Markdown 给 AI 阅读 | E2EE 解密 |
压缩字段文档 → AI 据此写爬虫 | 自动生成可运行的爬虫代码 |
适用于标准 HTTP JSON API 站点(小红书 / B站 / 电商)。不适用于加密数据流、wasm 混淆等逆向场景。
Related MCP server: ApiTap
原理
网站 → 浏览器 → 全文 Markdown
↓ ↓
网络监听 AI 阅读文本 → 选关键词
↓ ↓
API 捕获 搜索 → 匹配含关键词的 API
↓ ↓
字段文档 ←──────────┘
原始数据包保存到本地快速开始
git clone https://github.com/SanZiNEO/web-scout.git
cd web-scout
python -m venv .venv
.venv\Scripts\activate # Windows
pip install -e .MCP 配置
在 kilo.json 中添加:
"web-scout": {
"type": "local",
"command": ["path\\to\\web-scout\\.venv\\Scripts\\web-scout.exe"],
"enabled": true
}可选环境变量:
变量 | 默认值 | 说明 |
|
| 无头模式( |
| 自动 | 浏览器路径, |
| 临时 | 持久化用户文件夹,保留登录态 |
|
| 登录最大等待秒数 |
|
| 页面文本最大字符数 |
工具
工具 | 说明 |
| 打开页面 → 提取全文 Markdown → 开始监听网络 |
| 执行搜索、滚动等操作 |
| 等待用户手动登录 |
| 列出捕获的 API 端点 |
| 查看 API 的完整请求和响应 |
| 列出页面元素供 AI 选择 |
| 点击指定元素 |
| 关键字搜索:先搜 API body,无匹配自动回退到 DOM |
| 验证模式:打开页面 → 监听 → 按 path 匹配 API → 一步返回详情 |
| 验证模式:打开页面 → 按关键词扫 DOM 容器 → 一步返回 |
| 导出原始数据包 + 压缩字段文档 |
| 关闭当前浏览器会话,释放资源 |
示例
AI: scout_open("https://xiaohongshu.com/explore")
→ "页面文本: 减脂餐 健身计划 OOTD …"
AI: scout_action("search", "减脂餐")
→ "捕获 2 个新 API"
AI: scout_list_apis()
→ [1] POST /api/search/notes → 20 个字段
AI: scout_inspect_api(1)
→ POST https://edith.xiaohongshu.com/api/search/notes
请求体: {"keyword": "减脂餐", "page": 1, ...}
响应: code=0, data.items[]: 本次=20, id=..., title=...
AI: scout_export(1)
→ 字段文档 + 已保存: response/search_notes.json架构
src/web_scout/
├── server.py # FastMCP 入口 + 8 个工具
├── browser.py # Chromium 封装 + 文本提取 + 登录检测
├── monitor.py # 网络监听 + API 过滤 + 存储
├── dom.py # 元素扫描 + 容器合并
└── export.py # 压缩字段文档 + 原始数据包保存License
MIT © ShanZhi
免责声明
本项目(Web Scout)是一个通用的网页数据源发现工具,本身不发起爬取请求,不存储、不传输任何网站数据。使用者应:
遵守目标网站的
robots.txt和服务条款(Terms of Service)控制请求频率,不对目标网站造成异常负载
仅抓取公开数据,不绕过网站的认证和授权机制
自行承担使用本工具所产生的全部法律责任
项目作者(ShanZhi / SanZiNEO)不鼓励、不参与任何违反法律法规或网站条款的使用行为。本工具仅用于学习、研究和技术交流目的。
声明: 本项目由 AI 辅助开发,目标是帮助 AI 和开发者快速发现网页数据源,不包含任何破解、绕过或恶意功能。用户应遵守目标网站的 robots.txt 及相关法律法规。
This server cannot be installed
Maintenance
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
- Why MCP Servers Need Execution Sandboxing (And Why Your Current Stack Isn't Enough)By Om-Shree-0709 on .Agentic AiPrompt InjectionWebAssembly
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/SanZiNEO/web-scout'
If you have feedback or need assistance with the MCP directory API, please join our Discord server