Servidor MCP de obtención de documentos

Name: Docs Fetch MCP Server
Author: wolfyy970

Un servidor de Protocolo de Contexto de Modelo (MCP) para obtener contenido web con capacidades de exploración recursiva. Este servidor permite a los LLM explorar de forma autónoma páginas web y documentación para aprender sobre temas específicos.

Descripción general

El servidor MCP Docs Fetch ofrece a los LLM una forma sencilla pero eficaz de recuperar y explorar contenido web. Permite:

Obtener contenido limpio y legible de cualquier página web
Exploración recursiva de páginas vinculadas hasta una profundidad especificada
Recorrido de enlaces del mismo dominio para recopilar información completa
Filtrado inteligente de enlaces de navegación para centrarse en páginas con mucho contenido

Esta herramienta es particularmente útil cuando los usuarios desean que un LLM aprenda sobre un tema específico explorando documentación o contenido web.

Related MCP server: Fetch MCP Server

Características

Extracción de contenido : extrae de forma limpia el contenido principal de las páginas web, eliminando distracciones como navegación, anuncios y elementos irrelevantes.
Análisis de enlaces : identifica y extrae enlaces de la página, evaluando su relevancia
Exploración recursiva : sigue enlaces a contenido relacionado dentro del mismo dominio, hasta una profundidad especificada
Procesamiento paralelo : rastrea contenido de manera eficiente con solicitudes simultáneas y manejo adecuado de errores
Manejo robusto de errores : maneja con elegancia problemas de red, tiempos de espera y páginas malformadas.
Enfoque de doble estrategia : utiliza primero solicitudes rápidas de Axios y, como alternativa, Puppetteer para páginas más complejas.
Prevención de tiempo de espera : implementa el manejo de tiempo de espera global para garantizar un funcionamiento confiable dentro de los límites de tiempo de MCP
Resultados parciales : devuelve el contenido disponible incluso cuando algunas páginas no se cargan por completo

Uso

El servidor expone una única herramienta MCP:

`fetch_doc_content`

Obtiene contenido de páginas web con la capacidad de explorar páginas vinculadas hasta una profundidad específica.

Parámetros:

url (cadena, obligatoria): URL de la página web que se va a buscar
depth (número, opcional, predeterminado: 1): profundidad máxima de exploración de directorios/enlaces (1-5)

Devoluciones:

{ "rootUrl": "https://example.com/docs", "explorationDepth": 2, "pagesExplored": 5, "content": [ { "url": "https://example.com/docs", "title": "Documentation", "content": "Main page content...", "links": [ { "url": "https://example.com/docs/topic1", "text": "Topic 1" }, ... ] }, ... ] }