Provides tools for crawling and extracting data from Bilibili, including search functionality, video details, creator information, and time-range based searches with persistent login support via QR code authentication
MediaCrawler MCP 服务
让 AI 原生使用社媒数据的MCP服务。爬虫部分参考了MediaCrawler,将其 CLI 爬虫升级为 MCP 标准工具,让 Claude / ChatGPT 直连调用,一次配置,长期可用。

目录
项目简介
MediaCrawler MCP Service 是面向个人的数据获取工具集,通过 MCP(Model Context Protocol)把社媒公开信息变成 AI 助手可直接调用的标准化工具。核心能力包括“登录外部化管理”“任务级配置隔离”“浏览器上下文复用”和“结构化数据输出”。
本项目现已聚焦“高质量内容的爬取与自动化”,稳定与质量优先:
优先支持高质量生态:Bilibili、小红书,其次抖音、微博、知乎、贴吧等。
强调可持续的抗风控策略与最小化请求规模的精确抓取。
输出面向 AI 分析的扁平结构,避免冗余嵌套与噪声字段。
聚焦方向(高质量内容):
哔哩哔哩:视频内容与互动数据,适合视频分析与社交行为分析。
小红书:电商导购、产品推荐与品牌分析。
抖音:短视频与用户行为分析,适合营销效果评估。
微博:舆情分析与热点追踪。
知乎:知识管理与市场调研,专业领域分析价值高。
关键优势:
UI 升级为 FastMCP UI,管理页(/dashboard, /login, /config, /inspector)全部迁移并稳定运行。
重构爬虫配置装配:去冗余封装,收敛为函数式构建与更清晰的分层。
小红书改为 DOM 定位策略以降低风控敏感度,抓取更稳定(逐步完善中)。
Bilibili 登录与抓取逻辑优化,测试通过,运行稳定;移除部分 service 层 option 封装。
路由改为直接使用 FastMCP 路由与蓝图,统一注册与调试体验。
同时,数据持久化目录与展示统一为平台代号:
目录统一:
bili、xhs,不再使用历史目录名(如bilibili)。B 站媒体落盘路径:
data/bili/videos。“数据持久化概览”统计同时计入
json/csv与videos子目录体积。

从脚本到标准:可复用的 MCP 工具
media-crawler-mcp-service 打破了传统的临时脚本模式,转变为 可复用的标准化 MCP 工具。它支持多平台数据抓取,功能模块化设计让扩展和维护变得更加高效,不再需要重复编写脚本。
登录完全外部化:可视化界面 + 二维码/Cookie 双模式,状态持久
采用 外部化登录机制,提供 可视化界面 和 二维码/Cookie 双模式,让身份验证更加灵活。支持 登录状态持久化,避免频繁登录操作,提升了数据抓取的稳定性与便捷性。
真·工程化:分层解耦、Pydantic 模型、状态缓存与风控友好
采用 分层解耦架构 和 Pydantic 模型,保证了高效的数据验证和一致性。状态缓存 和 风控设计 让系统更加稳定,减少了负载并提高了抓取效率。
文本格式友好:适合 AI 分析,不返回冗余嵌套数据

与其他同类型MCP相比,media-crawler-mcp-service 返回的抓取数据 简洁、无冗余,特别适合 AI 分析。避免复杂的嵌套数据,让 AI 模型可以更轻松、更高效地处理数据。
特性 |
| xiaohongshu-mcp ( ) | MediaCrawler | Bowenwin MCP Server |
核心定位 | ✅ 多平台爬虫+发布MCP服务 | ✅ 小红书专项MCP | ❌ CLI爬虫脚本,非MCP | ✅ 基础MCP服务 |
支持平台 | ✅ B站、小红书、抖音、微博等多平台 | ⚠️ 仅小红书单平台 | ✅ 多平台CLI脚本 | ⚠️ 平台支持有限 |
技术栈 | 🐍 Python + Playwright + FastMCP | 🔷 Go + Playwright | 🐍 Python + Playwright | 🐍 Python |
从脚本到标准 | ✅ 标准化MCP工具,高度可复用 | ✅ 标准MCP实现 | ❌ 仅CLI脚本,不可复用 | ✅ 支持部分模块化 |
登录管理 | ✅ Web UI + 二维码/Cookie 双模式 | ✅ 独立登录工具 | ❌ 基础登录,无可视化 | ❌ 登录功能不完善 |
浏览器池管理 | ✅ 智能实例复用 + 延迟销毁 | ⚠️ 基础浏览器管理 | ❌ 无池化管理 | ❌ 无池化管理 |
工程化设计 | ✅ 分层解耦、Pydantic模型、Redis缓存 | ✅ 代码结构清晰 | ❌ 架构紧耦合 | ❌ 缺乏工程化设计 |
数据格式 | ✅ AI友好,扁平化JSON,无冗余 | ✅ 结构化JSON | ❌ 复杂嵌套JSON | ❌ 数据结构混乱 |
发布功能 | ✅ 小红书图文/视频发布(开发中) | ✅ 小红书图文/视频发布 | ❌ 无发布功能 | ❌ 无发布功能 |
管理界面 | ✅ FastMCP UI完整管理页 | ⚠️ 基础HTTP API | ❌ 无管理界面 | ❌ 无管理界面 |
扩展性 | ✅ 模块化设计,易扩展新平台 | ⚠️ 专注小红书单平台 | ❌ 扩展困难 | ⚠️ 扩展性一般 |
部署方式 | 🐳 Python服务 + Docker支持 | 🐳 Go二进制 + Docker | 🐍 Python脚本 | 🐍 Python服务 |
适用场景 | 🎯 多平台数据获取 + AI分析 + 自动发布 | 🎯 小红书深度运营 | 🎯 一次性数据采集 | 🎯 基础MCP集成 |
项目开发 Todo List
已完成
独立化登陆模块
B 站搜索/详情/创作者/评论
bili_searchbili_detailbili_creatorbili_comments
小红书搜索/详情/创作者/评论,最近风控,正在修复
xhs_searchxhs_detailxhs_creatorxhs_comments
进行中
抖音
知乎
微博
其他外部api
JWT 鉴权:简单集成并实现安全的身份验证机制
MCP/Resource,MCP/prompt的编写
增加部分渠道的文章发布功能
最佳 n8n 实践编写(欢迎共创):根据真是业务需求编写用到此mcp的 n8n 工作流并进行实际编写与优化。
非目标:
不做复杂权限管理,MCP一般作为个人本地服务/企业内部服务,接入企业内部网关鉴权更合理,这里不做复杂封装。
不做多账号池/多租户/分布式集群等复杂特性
保持架构清晰,提供可扩展点,鼓励他人自行按需扩展
快速开始
环境要求:Python 3.13+ · Redis · Chrome/Chromium ·(可选)Node.js 16+
克隆与安装依赖
配置环境
启动服务
管理界面与登录
1) 打开管理界面 http://localhost:9090/admin

2) 进入“登录管理”,选择平台(如 B 站)

3) 支持“二维码登录”或“Cookie 登录”,状态会持久化

在 AI 助手中使用
MCP 连接
MCP SSE 端点:
http://localhost:9090/mcp管理页面提供在线调试:
http://localhost:9090/inspector本地/内网默认无鉴权;公网部署请增加网关鉴权。
工具命名与平台代号
工具名统一为
{platform}_{tool},平台代号:bili(哔哩哔哩)、xhs(小红书)。已注册示例:
B 站:
bili_search、bili_crawler_detail、bili_crawler_creator、bili_search_time_range_http、bili_crawler_comments小红书:
xhs_search、xhs_crawler_detail、xhs_crawler_creator、xhs_crawler_comments
在 ChatGPT / Claude 中配置
将 MCP 服务器地址设置为上面的 SSE 端点。
选择相应工具名与参数调用;不确定参数时,先在
/inspector验证。
常用调用示例
B 站搜索(bili_search)
B 站视频详情(bili_crawler_detail)
小红书搜索(xhs_search)
小红书详情(xhs_crawler_detail,xsec_token 必传)
工具总览
管理页的 MCP Tools Inspector 会按平台分组展示已注册工具,并可在线调用调试。
工具分布(按平台分组)
服务工具(service)
service_info- 服务信息service_health- 健康检查list_tools- 工具列表tool_info- 工具详情
B 站(bili)
bili_search- 关键词搜索bili_crawler_detail- 视频详情bili_crawler_creator- 创作者内容/信息bili_search_time_range_http- 时间范围搜索bili_crawler_comments- 视频评论
小红书(xhs)
xhs_search- 关键词搜索xhs_crawler_detail- 笔记详情(需 xsec_token)xhs_crawler_creator- 创作者作品xhs_crawler_comments- 笔记评论

架构与技术选择
开发与贡献流程
Fork 并创建特性分支
阅读项目规范:
Agent.md:1本地开发与自测
提 PR 并说明变更点
FAQ
启动失败?
二维码不显示?
登录状态易失?
确认 Redis 稳定、网络正常;避免高频触发风控
搜索为空或慢?
优先使用
bili_search,降低分页尺寸,放大请求间隔
合规与合理使用
本项目定位为个人效率工具:
遵守各平台使用条款与 robots.txt
合理控制频率,不对平台造成压力
尊重内容创作者,不用于商业化爬取
建议单次请求量小、请求间隔 ≥ 2s
如果这个项目对你的学习有帮助,欢迎 ⭐ Star 支持!