Servidor MCP de obtención de documentos
Un servidor de Protocolo de Contexto de Modelo (MCP) para obtener contenido web con capacidades de exploración recursiva. Este servidor permite a los LLM explorar de forma autónoma páginas web y documentación para aprender sobre temas específicos.
Descripción general
El servidor MCP Docs Fetch ofrece a los LLM una forma sencilla pero eficaz de recuperar y explorar contenido web. Permite:
Obtener contenido limpio y legible de cualquier página web
Exploración recursiva de páginas vinculadas hasta una profundidad especificada
Recorrido de enlaces del mismo dominio para recopilar información completa
Filtrado inteligente de enlaces de navegación para centrarse en páginas con mucho contenido
Esta herramienta es particularmente útil cuando los usuarios desean que un LLM aprenda sobre un tema específico explorando documentación o contenido web.
Características
Extracción de contenido : extrae de forma limpia el contenido principal de las páginas web, eliminando distracciones como navegación, anuncios y elementos irrelevantes.
Análisis de enlaces : identifica y extrae enlaces de la página, evaluando su relevancia
Exploración recursiva : sigue enlaces a contenido relacionado dentro del mismo dominio, hasta una profundidad especificada
Procesamiento paralelo : rastrea contenido de manera eficiente con solicitudes simultáneas y manejo adecuado de errores
Manejo robusto de errores : maneja con elegancia problemas de red, tiempos de espera y páginas malformadas.
Enfoque de doble estrategia : utiliza primero solicitudes rápidas de Axios y, como alternativa, Puppetteer para páginas más complejas.
Prevención de tiempo de espera : implementa el manejo de tiempo de espera global para garantizar un funcionamiento confiable dentro de los límites de tiempo de MCP
Resultados parciales : devuelve el contenido disponible incluso cuando algunas páginas no se cargan por completo
Uso
El servidor expone una única herramienta MCP:
fetch_doc_content
Obtiene contenido de páginas web con la capacidad de explorar páginas vinculadas hasta una profundidad específica.
Parámetros:
url
(cadena, obligatoria): URL de la página web que se va a buscardepth
(número, opcional, predeterminado: 1): profundidad máxima de exploración de directorios/enlaces (1-5)
Devoluciones:
Instalación
Clonar este repositorio:
Instalar dependencias:
Construir el proyecto:
Configure los ajustes de MCP en su cliente Claude:
Dependencias
@modelcontextprotocol/sdk
: SDK del servidor MCPpuppeteer
: Navegador sin cabeza para la interacción con páginas webaxios
: cliente HTTP para realizar solicitudes
Desarrollo
Para ejecutar el servidor en modo de desarrollo:
Licencia
Instituto Tecnológico de Massachusetts (MIT)
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Tools
Permite a los LLM recuperar y explorar contenido web de forma autónoma mediante la búsqueda de páginas y el seguimiento recursivo de enlaces hasta una profundidad específica, lo que resulta especialmente útil para aprender sobre temas a partir de la documentación.
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityThis server enables LLMs to retrieve and process content from web pages, converting HTML to markdown for easier consumption.Last updated -169,593MIT License
- AsecurityAlicenseAqualityEnables retrieval and processing of web page content for LLMs by converting HTML to markdown, with support for content truncation and pagination.Last updated -12MIT License
- -securityAlicense-qualityEnhances LLM applications with deep autonomous web research capabilities, delivering higher quality information than standard search tools by exploring and validating numerous trusted sources.Last updated -249MIT License
- -securityAlicense-qualityEnables web browsing capabilities for locally served LLMs through URL text fetching, link extraction, and web search using Brave and DuckDuckGo engines. Designed to enhance LLMs with real-time web access through the MCP protocol.Last updated -1MIT License