Analizador de legibilidad del servidor MCP (Python/FastMCP)
Créditos/Referencias
Este proyecto se basa en la implementación original de emzimmer , basada en server-moz-readability . (Para consultar la documentación README original, consulte el archivo README.md original ).
Esta implementación de Python adapta el concepto original para ejecutarse como MCP basado en Python usando FastMCP
Servidor MCP del analizador de legibilidad de Mozilla
Una implementación en Python del servidor Model Context Protocol (MCP) que extrae y transforma el contenido de las páginas web en Markdown limpio y optimizado para LLM.
Tabla de contenido
Características
Elimina anuncios, navegación, pies de página y otro contenido no esencial.
Convierte HTML limpio en Markdown bien formateado
Maneja los errores con elegancia
Optimizado para el procesamiento LLM
Ligero y rápido
¿Por qué no simplemente buscar?
A diferencia de las solicitudes de búsqueda simples, este servidor:
Extrae solo contenido relevante mediante el algoritmo de legibilidad
Elimina ruidos como anuncios, ventanas emergentes y menús de navegación.
Reduce el uso de tokens al eliminar HTML/CSS innecesarios
Proporciona un formato Markdown consistente para un mejor procesamiento de LLM
Maneja páginas web complejas con contenido dinámico
Instalación
Clonar el repositorio:
Crear y activar un entorno virtual:
Instalar dependencias:
Inicio rápido
Iniciar el servidor:
Ejemplo de solicitud:
Referencia de herramientas
extract_content
Obtiene y transforma el contenido de la página web en Markdown limpio.
Argumentos:
Devoluciones:
Configuración del servidor MCP
Para configurar el servidor MCP, agregue lo siguiente a su archivo de configuración de MCP:
Luego se puede iniciar el servidor utilizando el protocolo MCP y acceder a él mediante la herramienta parse
.
Dependencias
readability-lxml - Extracción de contenido
html2text - Conversión de HTML a Markdown
beautifulsoup4 - Análisis del DOM
solicitudes - solicitudes HTTP
Licencia
Licencia MIT: consulte LICENCIA para obtener más detalles.
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Una implementación en Python de un servidor MCP que extrae contenido de páginas web, elimina anuncios y elementos no esenciales y lo transforma en Markdown limpio y optimizado para LLM.
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityA powerful MCP server for fetching and transforming web content into various formats (HTML, JSON, Markdown, Plain Text) with ease.Last updated -41,09537MIT License
- -securityAlicense-qualityA Python-based MCP server that crawls websites to extract and save content as markdown files, with features for mapping website structure and links.Last updated -3MIT License
- AsecurityAlicenseAqualityAn MCP server that retrieves web page content using Playwright headless browser, capable of extracting main content and converting to Markdown format.Last updated -23,066865MIT License
- AsecurityFlicenseAqualityAn MCP server that extracts meaningful content from websites and converts HTML to high-quality Markdown, using Mozilla's Readability engine.Last updated -16,0887