Skip to main content
Glama
ThreatFlux
by ThreatFlux

剧作家获取 MCP 服务器

GitHub 版本(按日期排序) CI 代码验证 许可证:MIT Python 版本 剧作家 微胶囊钙 代码样式:黑色

一个模型上下文协议 (MLM) 服务器,使用 Playwright 提供 Web 内容抓取功能,实现浏览器自动化。该服务器使 LLM 能够从网页中检索和处理 JavaScript 渲染的内容,并将 HTML 转换为 Markdown 格式,以便于使用。

作者

Wyatt Roersma在 Claude Code 的协助下创建。

Related MCP server: MCP Playwright CDP

主要特点

  • 浏览器自动化:使用 Playwright 呈现具有完整 JavaScript 支持的网页

  • 内容提取:自动识别并提取网页的主要内容区域

  • Markdown 转换:将 HTML 转换为干净、可读的 Markdown

  • 分页支持:通过分页处理大量内容

  • Robots.txt 合规性:尊重 robots.txt 指令以进行自主抓取

  • 代理支持:允许通过代理服务器路由请求

  • Docker Ready :可通过Docker HubGitHub Container Registry获取预构建的 Docker 镜像

可用工具

  • playwright-fetch - 使用 Playwright 浏览器自动化获取 URL 并将其内容提取为 markdown。

    • url (字符串,必需):要获取的 URL

    • max_length (整数,可选):返回的最大字符数(默认值:5000)

    • start_index (整数,可选):从此字符索引开始内容(默认值:0)

    • raw (布尔值,可选):获取不带 markdown 转换的原始内容(默认值:false)

    • wait_for_js (布尔值,可选):等待 JavaScript 执行(默认值:true)

提示

  • 剧作家取回

    • 使用 Playwright 获取 URL 并将其内容提取为 markdown

    • 参数:

      • url (字符串,必需):要获取的 URL

要求

  • Python 3.13.2 或更高版本

  • uv包管理器

  • 已安装 Playwright 浏览器

安装

1.使用uv安装(推荐)

uv pip install git+https://github.com/ThreatFlux/playwright-fetch.git # Install Playwright browsers uv pip exec playwright install

或者,克隆存储库并安装:

git clone https://github.com/ThreatFlux/playwright-fetch.git cd playwright-fetch uv pip install -e . # Install Playwright browsers uv pip exec playwright install

2.使用Docker

您可以使用我们从 Docker Hub 或 GitHub Container Registry 预先构建的 Docker 镜像:

# From Docker Hub docker pull threatflux/playwright-fetch:latest # From GitHub Container Registry docker pull ghcr.io/threatflux/playwright-fetch:latest

或者自己构建:

docker build -t threatflux/playwright-fetch .

配置

为 Claude.app 配置

添加到您的 Claude 设置:

"mcpServers": { "playwright-fetch": { "command": "uvx", "args": ["mcp-server-playwright-fetch"] } }
"mcpServers": { "playwright-fetch": { "command": "docker", "args": ["run", "-i", "--rm", "threatflux/playwright-fetch"] } }

配置 VS Code

对于手动安装,请将以下 JSON 块添加到 VS Code 中的用户设置 (JSON) 文件中。

{ "mcp": { "servers": { "playwright-fetch": { "command": "uvx", "args": ["mcp-server-playwright-fetch"] } } } }
{ "mcp": { "servers": { "playwright-fetch": { "command": "docker", "args": ["run", "-i", "--rm", "threatflux/playwright-fetch"] } } } }

命令行选项

该服务器支持以下命令行选项:

  • --user-agent :自定义 User-Agent 字符串

  • --ignore-robots-txt :忽略 robots.txt 限制

  • --proxy-url :用于请求的代理 URL

  • --headless :以无头模式运行浏览器(默认值:True)

  • --wait-until :何时认为导航成功(选项:“load”、“domcontentloaded”、“networkidle”、“commit”,默认值:“networkidle”)

示例用法

# Run with default settings uv run mcp-server-playwright-fetch # Run with a custom user agent and proxy uv run mcp-server-playwright-fetch --user-agent="MyCustomAgent/1.0" --proxy-url="http://myproxy:8080" # Run with visible browser for debugging uv run mcp-server-playwright-fetch --headless=false

调试

您可以使用 MCP 检查器来调试服务器:

npx @modelcontextprotocol/inspector uvx mcp-server-playwright-fetch

与标准 Fetch Server 的区别

此实现与标准获取 MCP 服务器有以下不同:

  1. 浏览器自动化:使用 Playwright 渲染 JavaScript 密集型页面

  2. 内容提取:尝试从常见的页面结构中提取主要内容

  3. 等待选项:可配置页面加载策略(等待加载、DOM内容、网络空闲)

  4. 可见浏览器选项:可以使用可见浏览器运行以进行调试

执照

本项目遵循 MIT 许可证。详情请参阅LICENSE文件。

One-click Deploy
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/ThreatFlux/playwright-fetch'

If you have feedback or need assistance with the MCP directory API, please join our Discord server