Playwright Fetch MCP Server
剧作家获取 MCP 服务器
一个模型上下文协议 (MLM) 服务器,使用 Playwright 提供 Web 内容抓取功能,实现浏览器自动化。该服务器使 LLM 能够从网页中检索和处理 JavaScript 渲染的内容,并将 HTML 转换为 Markdown 格式,以便于使用。
作者
由Wyatt Roersma在 Claude Code 的协助下创建。
Related MCP server: MCP Playwright CDP
主要特点
浏览器自动化:使用 Playwright 呈现具有完整 JavaScript 支持的网页
内容提取:自动识别并提取网页的主要内容区域
Markdown 转换:将 HTML 转换为干净、可读的 Markdown
分页支持:通过分页处理大量内容
Robots.txt 合规性:尊重 robots.txt 指令以进行自主抓取
代理支持:允许通过代理服务器路由请求
Docker Ready :可通过Docker Hub和GitHub Container Registry获取预构建的 Docker 镜像
可用工具
playwright-fetch- 使用 Playwright 浏览器自动化获取 URL 并将其内容提取为 markdown。url(字符串,必需):要获取的 URLmax_length(整数,可选):返回的最大字符数(默认值:5000)start_index(整数,可选):从此字符索引开始内容(默认值:0)raw(布尔值,可选):获取不带 markdown 转换的原始内容(默认值:false)wait_for_js(布尔值,可选):等待 JavaScript 执行(默认值:true)
提示
剧作家取回
使用 Playwright 获取 URL 并将其内容提取为 markdown
参数:
url(字符串,必需):要获取的 URL
要求
Python 3.13.2 或更高版本
uv包管理器
已安装 Playwright 浏览器
安装
1.使用uv安装(推荐)
uv pip install git+https://github.com/ThreatFlux/playwright-fetch.git
# Install Playwright browsers
uv pip exec playwright install或者,克隆存储库并安装:
git clone https://github.com/ThreatFlux/playwright-fetch.git
cd playwright-fetch
uv pip install -e .
# Install Playwright browsers
uv pip exec playwright install2.使用Docker
您可以使用我们从 Docker Hub 或 GitHub Container Registry 预先构建的 Docker 镜像:
# From Docker Hub
docker pull threatflux/playwright-fetch:latest
# From GitHub Container Registry
docker pull ghcr.io/threatflux/playwright-fetch:latest或者自己构建:
docker build -t threatflux/playwright-fetch .配置
为 Claude.app 配置
添加到您的 Claude 设置:
"mcpServers": {
"playwright-fetch": {
"command": "uvx",
"args": ["mcp-server-playwright-fetch"]
}
}"mcpServers": {
"playwright-fetch": {
"command": "docker",
"args": ["run", "-i", "--rm", "threatflux/playwright-fetch"]
}
}配置 VS Code
对于手动安装,请将以下 JSON 块添加到 VS Code 中的用户设置 (JSON) 文件中。
{
"mcp": {
"servers": {
"playwright-fetch": {
"command": "uvx",
"args": ["mcp-server-playwright-fetch"]
}
}
}
}{
"mcp": {
"servers": {
"playwright-fetch": {
"command": "docker",
"args": ["run", "-i", "--rm", "threatflux/playwright-fetch"]
}
}
}
}命令行选项
该服务器支持以下命令行选项:
--user-agent:自定义 User-Agent 字符串--ignore-robots-txt:忽略 robots.txt 限制--proxy-url:用于请求的代理 URL--headless:以无头模式运行浏览器(默认值:True)--wait-until:何时认为导航成功(选项:“load”、“domcontentloaded”、“networkidle”、“commit”,默认值:“networkidle”)
示例用法
# Run with default settings
uv run mcp-server-playwright-fetch
# Run with a custom user agent and proxy
uv run mcp-server-playwright-fetch --user-agent="MyCustomAgent/1.0" --proxy-url="http://myproxy:8080"
# Run with visible browser for debugging
uv run mcp-server-playwright-fetch --headless=false调试
您可以使用 MCP 检查器来调试服务器:
npx @modelcontextprotocol/inspector uvx mcp-server-playwright-fetch与标准 Fetch Server 的区别
此实现与标准获取 MCP 服务器有以下不同:
浏览器自动化:使用 Playwright 渲染 JavaScript 密集型页面
内容提取:尝试从常见的页面结构中提取主要内容
等待选项:可配置页面加载策略(等待加载、DOM内容、网络空闲)
可见浏览器选项:可以使用可见浏览器运行以进行调试
执照
本项目遵循 MIT 许可证。详情请参阅LICENSE文件。
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Tools
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/ThreatFlux/playwright-fetch'
If you have feedback or need assistance with the MCP directory API, please join our Discord server