
Doc Scraper MCP 服务器
提供文档抓取功能的模型上下文协议 (MCP) 服务器。该服务器使用 jina.ai 的转换服务将基于 Web 的文档转换为 Markdown 格式。
特征
- 从任何网址抓取文档 
- 将 HTML 文档转换为 markdown 格式 
- 将转换后的文档保存到指定的输出路径 
- 与模型上下文协议 (MCP) 集成 
安装
通过 Smithery 安装
要通过Smithery自动安装适用于 Claude Desktop 的 Doc Scraper:
- 克隆存储库: 
- 创建并激活虚拟环境: 
- 安装依赖项: 
用法
可以使用 Python 运行服务器:
工具描述
服务器提供一个单一工具:
- 名称: - scrape_docs
- 描述:从 URL 抓取文档并保存为 markdown 
- 输入参数: - url:要抓取的文档的 URL
- output_path:markdown 文件的保存路径
 
项目结构
依赖项
- aiohttp 
- 甲基氯丙烯 
- 派丹蒂克 
发展
设置开发环境:
- 安装开发依赖项: 
- 服务器使用模型上下文协议 (MCP)。请务必熟悉MCP 文档。 
执照
MIT 许可证
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
使用 jina.ai 的转换服务将基于 Web 的文档转换为 markdown 格式,允许用户从任何 URL 抓取文档并将其保存为 markdown 文件。
Related Resources
Related MCP Servers
- Asecurity-licenseAqualityConverts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.Last updated -1072,163MIT License
- Asecurity-licenseAqualityA document conversion server that transforms various file formats (PDFs, documents, images, audio, web content) to Markdown with improved multilingual and UTF-8 support.Last updated -10110MIT License
- Asecurity-licenseAqualityA server that converts various file formats (PDF, images, Office documents, etc.) to Markdown descriptions using Cloudflare AI services.Last updated -1434
- Asecurity-licenseAqualityFast, token-efficient web content extraction tool that converts websites to clean Markdown for AI agents, featuring smart caching, content extraction with Mozilla Readability, and polite crawling capabilities.Last updated -114891MIT License