剧作家获取 MCP 服务器
一个模型上下文协议 (MLM) 服务器,使用 Playwright 提供 Web 内容抓取功能,实现浏览器自动化。该服务器使 LLM 能够从网页中检索和处理 JavaScript 渲染的内容,并将 HTML 转换为 Markdown 格式,以便于使用。
作者
由Wyatt Roersma在 Claude Code 的协助下创建。
Related MCP server: MCP Playwright CDP
主要特点
浏览器自动化:使用 Playwright 呈现具有完整 JavaScript 支持的网页
内容提取:自动识别并提取网页的主要内容区域
Markdown 转换:将 HTML 转换为干净、可读的 Markdown
分页支持:通过分页处理大量内容
Robots.txt 合规性:尊重 robots.txt 指令以进行自主抓取
代理支持:允许通过代理服务器路由请求
Docker Ready :可通过Docker Hub和GitHub Container Registry获取预构建的 Docker 镜像
可用工具
playwright-fetch- 使用 Playwright 浏览器自动化获取 URL 并将其内容提取为 markdown。url(字符串,必需):要获取的 URLmax_length(整数,可选):返回的最大字符数(默认值:5000)start_index(整数,可选):从此字符索引开始内容(默认值:0)raw(布尔值,可选):获取不带 markdown 转换的原始内容(默认值:false)wait_for_js(布尔值,可选):等待 JavaScript 执行(默认值:true)
提示
剧作家取回
使用 Playwright 获取 URL 并将其内容提取为 markdown
参数:
url(字符串,必需):要获取的 URL
要求
Python 3.13.2 或更高版本
uv包管理器
已安装 Playwright 浏览器
安装
1.使用uv安装(推荐)
或者,克隆存储库并安装:
2.使用Docker
您可以使用我们从 Docker Hub 或 GitHub Container Registry 预先构建的 Docker 镜像:
或者自己构建:
配置
为 Claude.app 配置
添加到您的 Claude 设置:
配置 VS Code
对于手动安装,请将以下 JSON 块添加到 VS Code 中的用户设置 (JSON) 文件中。
命令行选项
该服务器支持以下命令行选项:
--user-agent:自定义 User-Agent 字符串--ignore-robots-txt:忽略 robots.txt 限制--proxy-url:用于请求的代理 URL--headless:以无头模式运行浏览器(默认值:True)--wait-until:何时认为导航成功(选项:“load”、“domcontentloaded”、“networkidle”、“commit”,默认值:“networkidle”)
示例用法
调试
您可以使用 MCP 检查器来调试服务器:
与标准 Fetch Server 的区别
此实现与标准获取 MCP 服务器有以下不同:
浏览器自动化:使用 Playwright 渲染 JavaScript 密集型页面
内容提取:尝试从常见的页面结构中提取主要内容
等待选项:可配置页面加载策略(等待加载、DOM内容、网络空闲)
可见浏览器选项:可以使用可见浏览器运行以进行调试
执照
本项目遵循 MIT 许可证。详情请参阅LICENSE文件。