A
securityA
licenseA
qualityA powerful MCP server for fetching and transforming web content into various formats (HTML, JSON, Markdown, Plain Text) with ease.
Last updated -
4
146
12
TypeScript
MIT License
MCP 服务器使用 Playwright 无头浏览器获取网页内容。
fetch_urls
工具可以并发获取多个URL,显著提高批量操作的效率。直接用npx运行:
首次设置 - 通过在终端中运行以下命令来安装所需的浏览器:
使用--debug
选项运行以显示用于调试的浏览器窗口:
在 Claude Desktop 中配置此 MCP 服务器:
在 MacOS 上: ~/Library/Application Support/Claude/claude_desktop_config.json
在 Windows 上: %APPDATA%/Claude/claude_desktop_config.json
fetch_url
- 从指定的 URL 检索网页内容url
:要获取的网页的 URL(必需参数)timeout
:页面加载超时时间(毫秒),默认为 30000(30 秒)waitUntil
:指定导航何时被视为完成,选项:'load'、'domcontentloaded'、'networkidle'、'commit',默认为'load'extractContent
:是否智能提取主要内容,默认为 truemaxLength
:返回内容的最大长度(以字符为单位),默认无限制returnHtml
:是否返回 HTML 内容而不是 Markdown,默认为 falsewaitForNavigation
:是否在初始页面加载后等待额外的导航(对于具有反机器人验证的网站很有用),默认值为 falsenavigationTimeout
:等待额外导航的最长时间(以毫秒为单位),默认值为 10000(10 秒)disableMedia
:是否禁用媒体资源(图片、样式表、字体、媒体),默认为 truedebug
:是否启用调试模式(显示浏览器窗口),如果指定,则覆盖 --debug 命令行标志fetch_urls
- 并行从多个 URL 批量检索网页内容urls
:要获取的 URL 数组(必需参数)fetch_url
相同waitForNavigation: true
参数。timeout
和navigationTimeout
参数。extractContent: false
和returnHtml: true
。extractContent: false
。returnHtml: true
。--debug
标志,也会设置debug: true
。debug: true
或使用--debug
标志,保持浏览器窗口打开以进行手动登录。debug: true
,打开浏览器窗口进行手动登录。安装 Playwright 所需的浏览器:
使用 MCP Inspector 进行调试:
您还可以启用可见浏览器模式进行调试:
根据MIT 许可证授权
You must be authenticated.
local-only server
The server can only run on the client's local machine because it depends on local resources.
使用 Playwright 无头浏览器检索网页内容的 MCP 服务器,能够提取主要内容并转换为 Markdown 格式。
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/jae-jae/fetcher-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server