Skip to main content
Glama

Mozilla Readability Parser MCP Server

by emzimmer

Servidor MCP del analizador de legibilidad de Mozilla

Un servidor de protocolo de contexto de modelo (MCP) que extrae y transforma el contenido de páginas web en Markdown limpio y optimizado para LLM. Devuelve el título del artículo, el contenido principal, un extracto, la firma y el nombre del sitio. Utiliza el algoritmo de legibilidad de Mozilla para eliminar anuncios, navegación, pies de página y elementos no esenciales, a la vez que conserva la estructura principal del contenido. Más información sobre MCP .

Características

  • Elimina anuncios, navegación, pies de página y otro contenido no esencial.
  • Convierte HTML limpio en Markdown bien formateado (también utiliza Turndown)
  • Devuelve metadatos del artículo (título, extracto, firma, nombre del sitio)
  • Maneja los errores con elegancia

¿Por qué no simplemente buscar?

A diferencia de las solicitudes de búsqueda simples, este servidor:

  • Extrae únicamente contenido relevante utilizando el algoritmo de legibilidad de Mozilla
  • Elimina ruidos como anuncios, ventanas emergentes y menús de navegación.
  • Reduce el uso de tokens al eliminar HTML/CSS innecesarios
  • Proporciona un formato Markdown consistente para un mejor procesamiento de LLM
  • Incluye metadatos útiles sobre el contenido.

Instalación

Instalación mediante herrería

Para instalar Mozilla Readability Parser para Claude Desktop automáticamente a través de Smithery :

npx -y @smithery/cli install server-moz-readability --client claude

Instalación manual

npm install server-moz-readability

Referencia de herramientas

parse

Obtiene y transforma el contenido de la página web en Markdown limpio.

Argumentos:

{ "url": { "type": "string", "description": "The website URL to parse", "required": true } }

Devoluciones:

{ "title": "Article title", "content": "Markdown content...", "metadata": { "excerpt": "Brief summary", "byline": "Author information", "siteName": "Source website name" } }

Uso con Claude Desktop

Añade a tu claude_desktop_config.json :

{ "mcpServers": { "readability": { "command": "npx", "args": ["-y", "server-moz-readability"] } } }

Dependencias

  • @mozilla/readability - Extracción de contenido
  • Turndown - Conversión de HTML a Markdown
  • jsdom - Análisis del DOM
  • axios - Solicitudes HTTP

Licencia

Instituto Tecnológico de Massachusetts (MIT)

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Tools

Extrae y transforma el contenido de la página web en Markdown limpio y optimizado para LLM. Devuelve el título del artículo, el contenido principal, un extracto, la firma y el nombre del sitio. Utiliza el algoritmo de legibilidad de Mozilla para eliminar anuncios, navegación, pies de página y elementos no esenciales, conservando la estructura principal del contenido.

  1. Características
    1. ¿Por qué no simplemente buscar?
      1. Instalación
        1. Instalación mediante herrería
        2. Instalación manual
      2. Referencia de herramientas
        1. parse
      3. Uso con Claude Desktop
        1. Dependencias
          1. Licencia

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              This server enables LLMs to retrieve and process content from web pages, converting HTML to markdown for easier consumption.
              Last updated -
              1
              50,383
              Python
              MIT License
              • Linux
              • Apple
            • A
              security
              A
              license
              A
              quality
              Provides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.
              Last updated -
              4
              125,855
              353
              TypeScript
              MIT License
            • A
              security
              A
              license
              A
              quality
              This server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.
              Last updated -
              1
              5
              JavaScript
              MIT License
              • Apple
            • -
              security
              A
              license
              -
              quality
              Enables retrieval and processing of web page content for LLMs by converting HTML to markdown, with support for content truncation and pagination.
              Last updated -
              1
              1
              Python
              MIT License

            View all related MCP servers

            MCP directory API

            We provide all the information about MCP servers via our MCP API.

            curl -X GET 'https://glama.ai/api/mcp/v1/servers/emzimmer/server-moz-readability'

            If you have feedback or need assistance with the MCP directory API, please join our Discord server