Skip to main content
Glama

Mozilla Readability Parser MCP Server

by emzimmer

Mozilla Readability 解析器 MCP 服务器

一个模型上下文协议 (MCP)服务器,用于提取网页内容并将其转换为干净的、LLM 优化的 Markdown 格式。返回文章标题、正文、摘录、署名和网站名称。使用Mozilla 的 Readability 算法移除广告、导航、页脚和不必要的元素,同时保留核心内容结构。了解更多关于 MCP 的信息

特征

  • 删除广告、导航、页脚和其他非必要内容
  • 将干净的 HTML 转换为格式良好的 Markdown(也使用 Turndown)
  • 返回文章元数据(标题、摘录、署名、网站名称)
  • 优雅地处理错误

为什么不直接获取?

与简单的获取请求不同,此服务器:

  • 使用 Mozilla 的可读性算法仅提取相关内容
  • 消除广告、弹出窗口和导航菜单等噪音
  • 通过删除不必要的 HTML/CSS 来减少令牌的使用
  • 提供一致的 Markdown 格式,以便更好地处理 LLM
  • 包含有关内容的有用元数据

安装

通过 Smithery 安装

要通过Smithery自动为 Claude Desktop 安装 Mozilla Readability Parser:

npx -y @smithery/cli install server-moz-readability --client claude

手动安装

npm install server-moz-readability

工具参考

parse

获取网页内容并将其转换为干净的 Markdown。

参数:

{ "url": { "type": "string", "description": "The website URL to parse", "required": true } }

返回:

{ "title": "Article title", "content": "Markdown content...", "metadata": { "excerpt": "Brief summary", "byline": "Author information", "siteName": "Source website name" } }

与 Claude Desktop 一起使用

添加到您的claude_desktop_config.json

{ "mcpServers": { "readability": { "command": "npx", "args": ["-y", "server-moz-readability"] } } }

依赖项

  • @mozilla/readability——内容提取
  • turndown - HTML 到 Markdown 的转换
  • jsdom——DOM 解析
  • axios - HTTP 请求

执照

麻省理工学院

Install Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Tools

提取网页内容并将其转换为简洁、LLM 优化的 Markdown 格式。返回文章标题、正文、摘录、署名和网站名称。使用 Mozilla 的 Readability 算法去除广告、导航、页脚和非必要元素,同时保留核心内容结构。

  1. 特征
    1. 为什么不直接获取?
      1. 安装
        1. 通过 Smithery 安装
        2. 手动安装
      2. 工具参考
        1. parse
      3. 与 Claude Desktop 一起使用
        1. 依赖项
          1. 执照

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              Enables web content scanning and analysis by fetching, analyzing, and extracting information from web pages using tools like page fetching, link extraction, site crawling, and more.
              Last updated -
              6
              9
              TypeScript
              MIT License
            • A
              security
              A
              license
              A
              quality
              This server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.
              Last updated -
              1
              9
              JavaScript
              MIT License
              • Apple
            • -
              security
              A
              license
              -
              quality
              Enables retrieval and processing of web page content for LLMs by converting HTML to markdown, with support for content truncation and pagination.
              Last updated -
              1
              1
              Python
              MIT License
            • -
              security
              A
              license
              -
              quality
              A Python implementation of an MCP server that extracts webpage content, removes ads and non-essential elements, and transforms it into clean, LLM-optimized Markdown.
              Last updated -
              2
              Python
              MIT License
              • Linux
              • Apple

            View all related MCP servers

            MCP directory API

            We provide all the information about MCP servers via our MCP API.

            curl -X GET 'https://glama.ai/api/mcp/v1/servers/emzimmer/server-moz-readability'

            If you have feedback or need assistance with the MCP directory API, please join our Discord server