A
securityA
licenseA
qualityA powerful MCP server for fetching and transforming web content into various formats (HTML, JSON, Markdown, Plain Text) with ease.
Last updated -
4
146
12
TypeScript
MIT License
基于 Python 的 MCP( https://modelcontextprotocol.io/introduction )网络爬虫,用于提取和保存网站内容。
爬取的内容以markdown格式保存在指定的输出目录中。
可以通过环境变量配置服务器:
OUTPUT_PATH
:保存文件的默认输出目录MAX_CONCURRENT_REQUESTS
:最大并行请求数(默认值:5)REQUEST_TIMEOUT
:请求超时(秒)(默认值:30)使用 FastMCP 安装fastmcp install server.py
或用户自定义设置直接使用 fastmcp 运行
它有助于使用https://modelcontextprotocol.io/docs/tools/inspector进行调试
git checkout -b feature/AmazingFeature
)git commit -m 'Add some AmazingFeature'
)git push origin feature/AmazingFeature
)根据 MIT 许可证分发。更多信息请参阅LICENSE
。
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
基于 Python 的 MCP 服务器,可抓取网站以提取内容并将其保存为 markdown 文件,并具有映射网站结构和链接的功能。
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/jmh108/md-webcrawl-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server