Mozilla Readability 解析器 MCP 服务器
一个模型上下文协议 (MCP)服务器,用于提取网页内容并将其转换为干净的、LLM 优化的 Markdown 格式。返回文章标题、正文、摘录、署名和网站名称。使用Mozilla 的 Readability 算法移除广告、导航、页脚和不必要的元素,同时保留核心内容结构。了解更多关于 MCP 的信息。
特征
删除广告、导航、页脚和其他非必要内容
将干净的 HTML 转换为格式良好的 Markdown(也使用 Turndown)
返回文章元数据(标题、摘录、署名、网站名称)
优雅地处理错误
Related MCP server: Skrape MCP Server
为什么不直接获取?
与简单的获取请求不同,此服务器:
使用 Mozilla 的可读性算法仅提取相关内容
消除广告、弹出窗口和导航菜单等噪音
通过删除不必要的 HTML/CSS 来减少令牌的使用
提供一致的 Markdown 格式,以便更好地处理 LLM
包含有关内容的有用元数据
安装
通过 Smithery 安装
要通过Smithery自动为 Claude Desktop 安装 Mozilla Readability Parser:
手动安装
工具参考
parse
获取网页内容并将其转换为干净的 Markdown。
参数:
返回:
与 Claude Desktop 一起使用
添加到您的claude_desktop_config.json :
依赖项
@mozilla/readability——内容提取
turndown - HTML 到 Markdown 的转换
jsdom——DOM 解析
axios - HTTP 请求
执照
麻省理工学院