Servidor MCP de obtención de documentos
Un servidor de Protocolo de Contexto de Modelo (MCP) para obtener contenido web con capacidades de exploración recursiva. Este servidor permite a los LLM explorar de forma autónoma páginas web y documentación para aprender sobre temas específicos.
Descripción general
El servidor MCP Docs Fetch ofrece a los LLM una forma sencilla pero eficaz de recuperar y explorar contenido web. Permite:
Obtener contenido limpio y legible de cualquier página web
Exploración recursiva de páginas vinculadas hasta una profundidad especificada
Recorrido de enlaces del mismo dominio para recopilar información completa
Filtrado inteligente de enlaces de navegación para centrarse en páginas con mucho contenido
Esta herramienta es particularmente útil cuando los usuarios desean que un LLM aprenda sobre un tema específico explorando documentación o contenido web.
Related MCP server: Fetch MCP Server
Características
Extracción de contenido : extrae de forma limpia el contenido principal de las páginas web, eliminando distracciones como navegación, anuncios y elementos irrelevantes.
Análisis de enlaces : identifica y extrae enlaces de la página, evaluando su relevancia
Exploración recursiva : sigue enlaces a contenido relacionado dentro del mismo dominio, hasta una profundidad especificada
Procesamiento paralelo : rastrea contenido de manera eficiente con solicitudes simultáneas y manejo adecuado de errores
Manejo robusto de errores : maneja con elegancia problemas de red, tiempos de espera y páginas malformadas.
Enfoque de doble estrategia : utiliza primero solicitudes rápidas de Axios y, como alternativa, Puppetteer para páginas más complejas.
Prevención de tiempo de espera : implementa el manejo de tiempo de espera global para garantizar un funcionamiento confiable dentro de los límites de tiempo de MCP
Resultados parciales : devuelve el contenido disponible incluso cuando algunas páginas no se cargan por completo
Uso
El servidor expone una única herramienta MCP:
fetch_doc_content
Obtiene contenido de páginas web con la capacidad de explorar páginas vinculadas hasta una profundidad específica.
Parámetros:
url(cadena, obligatoria): URL de la página web que se va a buscardepth(número, opcional, predeterminado: 1): profundidad máxima de exploración de directorios/enlaces (1-5)
Devoluciones:
Instalación
Clonar este repositorio:
Instalar dependencias:
Construir el proyecto:
Configure los ajustes de MCP en su cliente Claude:
Dependencias
@modelcontextprotocol/sdk: SDK del servidor MCPpuppeteer: Navegador sin cabeza para la interacción con páginas webaxios: cliente HTTP para realizar solicitudes
Desarrollo
Para ejecutar el servidor en modo de desarrollo:
Licencia
Instituto Tecnológico de Massachusetts (MIT)