Skip to main content
Glama

Mozilla Readability Parser MCP Server

by jmh108
MIT License
1
  • Linux
  • Apple

Analizador de legibilidad del servidor MCP (Python/FastMCP)

Créditos/Referencias

Este proyecto se basa en la implementación original de emzimmer , basada en server-moz-readability . (Para consultar la documentación README original, consulte el archivo README.md original ).

Esta implementación de Python adapta el concepto original para ejecutarse como MCP basado en Python usando FastMCP

Servidor MCP del analizador de legibilidad de Mozilla

Una implementación en Python del servidor Model Context Protocol (MCP) que extrae y transforma el contenido de las páginas web en Markdown limpio y optimizado para LLM.

Tabla de contenido

Características

  • Elimina anuncios, navegación, pies de página y otro contenido no esencial.
  • Convierte HTML limpio en Markdown bien formateado
  • Maneja los errores con elegancia
  • Optimizado para el procesamiento LLM
  • Ligero y rápido

¿Por qué no simplemente buscar?

A diferencia de las solicitudes de búsqueda simples, este servidor:

  • Extrae solo contenido relevante mediante el algoritmo de legibilidad
  • Elimina ruidos como anuncios, ventanas emergentes y menús de navegación.
  • Reduce el uso de tokens al eliminar HTML/CSS innecesarios
  • Proporciona un formato Markdown consistente para un mejor procesamiento de LLM
  • Maneja páginas web complejas con contenido dinámico

Instalación

  1. Clonar el repositorio:
git clone https://github.com/jmh108/MCP-server-readability-python.git cd MCP-server-readability-python
  1. Crear y activar un entorno virtual:
python -m venv venv source venv/bin/activate # On Windows use: venv\Scripts\activate
  1. Instalar dependencias:
pip install -r requirements.txt

Inicio rápido

  1. Iniciar el servidor:
fastmcp run server.py
  1. Ejemplo de solicitud:
curl -X POST http://localhost:8000/tools/extract_content \ -H "Content-Type: application/json" \ -d '{"url": "https://example.com/article"}'

Referencia de herramientas

extract_content

Obtiene y transforma el contenido de la página web en Markdown limpio.

Argumentos:

{ "url": { "type": "string", "description": "The website URL to parse", "required": true } }

Devoluciones:

{ "content": "Markdown content..." }

Configuración del servidor MCP

Para configurar el servidor MCP, agregue lo siguiente a su archivo de configuración de MCP:

{ "mcpServers": { "readability": { "command": "fastmcp", "args": ["run", "server.py"], "env": {} } } }

Luego se puede iniciar el servidor utilizando el protocolo MCP y acceder a él mediante la herramienta parse .

Dependencias

Licencia

Licencia MIT: consulte LICENCIA para obtener más detalles.

-
security - not tested
A
license - permissive license
-
quality - not tested

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Una implementación en Python de un servidor MCP que extrae contenido de páginas web, elimina anuncios y elementos no esenciales y lo transforma en Markdown limpio y optimizado para LLM.

  1. Créditos/Referencias
    1. Servidor MCP del analizador de legibilidad de Mozilla
      1. Tabla de contenido
      2. Características
      3. ¿Por qué no simplemente buscar?
      4. Instalación
      5. Inicio rápido
      6. Referencia de herramientas
      7. Configuración del servidor MCP
      8. Dependencias
      9. Licencia

    Related MCP Servers

    • A
      security
      A
      license
      A
      quality
      A powerful MCP server for fetching and transforming web content into various formats (HTML, JSON, Markdown, Plain Text) with ease.
      Last updated -
      4
      146
      12
      TypeScript
      MIT License
      • Apple
      • Linux
    • -
      security
      A
      license
      -
      quality
      A Python-based MCP server that crawls websites to extract and save content as markdown files, with features for mapping website structure and links.
      Last updated -
      1
      Python
      MIT License
    • A
      security
      A
      license
      A
      quality
      An MCP server that retrieves web page content using Playwright headless browser, capable of extracting main content and converting to Markdown format.
      Last updated -
      2
      651
      727
      TypeScript
      MIT License
      • Apple
    • -
      security
      F
      license
      -
      quality
      An MCP server that extracts meaningful content from websites and converts HTML to high-quality Markdown, using Mozilla's Readability engine.
      Last updated -
      11,993
      2
      JavaScript

    View all related MCP servers

    MCP directory API

    We provide all the information about MCP servers via our MCP API.

    curl -X GET 'https://glama.ai/api/mcp/v1/servers/jmh108/MCP-server-readability-python'

    If you have feedback or need assistance with the MCP directory API, please join our Discord server