Servidor de investigación web profunda MCP (v0.3.0)
Un servidor de Protocolo de Contexto Modelo (MCP) para investigación web avanzada.
Últimos cambios
- Se agregó la herramienta visit_page para la extracción directa de contenido de la página web
- Rendimiento optimizado para trabajar dentro de los límites de tiempo de espera de MCP
- Parámetros maxDepth y maxBranching predeterminados reducidos
- Eficiencia de carga de páginas mejorada
- Se agregaron controles de tiempo de espera durante todo el proceso.
- Manejo mejorado de errores en tiempos de espera
Este proyecto es una bifurcación de mcp-webresearch de mzxrai , mejorada con funciones adicionales para la investigación en la web profunda. Agradecemos a los creadores originales su labor fundacional.
Incorpore información en tiempo real a Claude con colas de búsqueda inteligentes, extracción de contenido mejorada y capacidades de investigación profunda.
Características
- Sistema de cola de búsqueda inteligente
- Operaciones de búsqueda por lotes con limitación de velocidad
- Gestión de colas con seguimiento del progreso
- Recuperación de errores y reintentos automáticos
- Desduplicación de resultados de búsqueda
- Extracción de contenido mejorada
- Puntuación de relevancia basada en TF-IDF
- Análisis de proximidad de palabras clave
- Ponderación de la sección de contenido
- Puntuación de legibilidad
- Análisis mejorado de la estructura HTML
- Extracción de datos estructurados
- Mejor limpieza y formato de contenido
- Características principales
- Integración de búsqueda de Google
- Extracción de contenido de páginas web
- Seguimiento de sesiones de investigación
- Conversión de Markdown con formato mejorado
Prerrequisitos
- Node.js >= 18 (incluye
npm
ynpx
) - Aplicación de escritorio Claude
Instalación
Instalación global (recomendada)
Instalación de proyecto local
Integración de escritorio de Claude
Después de instalar el paquete, agregue esta entrada a su claude_desktop_config.json
:
Ventanas
Ubicación: %APPDATA%\Claude\claude_desktop_config.json
macOS
Ubicación: ~/Library/Application Support/Claude/claude_desktop_config.json
Esta configuración permite que Claude Desktop inicie automáticamente el servidor de investigación web MCP cuando sea necesario.
Configuración por primera vez
Después de la instalación, ejecute este comando para instalar las dependencias necesarias del navegador:
Uso
Simplemente inicia un chat con Claude y envía una propuesta que se beneficie de una investigación web. Si deseas una propuesta prediseñada y personalizada para una investigación web más profunda, puedes usar la propuesta agentic-research
que ofrecemos en este paquete. Accede a esa propuesta en Claude Desktop haciendo clic en el icono del clip en la entrada del chat y seleccionando " Choose an integration
→ deepwebresearch
→ agentic-research
.
Herramientas
deep_research
- Realiza una investigación exhaustiva con análisis de contenido.
- Argumentos:
- Devoluciones:
parallel_search
- Realiza múltiples búsquedas de Google en paralelo con cola inteligente
- Argumentos:
{ queries: string[], maxParallel?: number }
- Nota: maxParallel está limitado a 5 para garantizar un rendimiento confiable
visit_page
- Visita una página web y extrae su contenido
- Argumentos:
{ url: string }
- Devoluciones:
Indicaciones
agentic-research
Una guía de investigación que ayuda a Claude a realizar una investigación web exhaustiva. La guía le indica a Claude que:
- Comience con búsquedas amplias para comprender el panorama temático.
- Priorizar fuentes confiables y de alta calidad
- Refinar iterativamente la dirección de la investigación en función de los hallazgos
- Manténgase informado y permítanos guiar la investigación de forma interactiva.
- Cite siempre las fuentes con URL
Opciones de configuración
El servidor se puede configurar a través de variables de entorno:
MAX_PARALLEL_SEARCHES
: Número máximo de búsquedas simultáneas (predeterminado: 5)SEARCH_DELAY_MS
: Retraso entre búsquedas en milisegundos (valor predeterminado: 200)MAX_RETRIES
: Número de reintentos para solicitudes fallidas (valor predeterminado: 3)TIMEOUT_MS
: Tiempo de espera de la solicitud en milisegundos (valor predeterminado: 55000)LOG_LEVEL
: Nivel de registro (predeterminado: 'info')
Manejo de errores
Problemas comunes
- Limitación de velocidad
- Síntoma: Error "Demasiadas solicitudes"
- Solución: Aumente
SEARCH_DELAY_MS
o disminuyaMAX_PARALLEL_SEARCHES
- Tiempos de espera de la red
- Síntoma: Error "Tiempo de espera agotado"
- Solución: Asegúrese de que las solicitudes se completen dentro del tiempo de espera de MCP de 60 segundos
- Problemas con el navegador
- Síntoma: Error "No se pudo iniciar el navegador"
- Solución: asegúrese de que Playwright esté instalado correctamente (
npx playwright install
)
Depuración
Este software es beta. Si tiene algún problema:
- Consulte los registros MCP de Claude Desktop:
- Habilitar el registro de depuración:
Desarrollo
Configuración
Pruebas
Calidad del código
Contribuyendo
- Bifurcar el repositorio
- Crea tu rama de funciones (
git checkout -b feature/amazing-feature
) - Confirme sus cambios (
git commit -m 'Add some amazing feature'
) - Empujar a la rama (
git push origin feature/amazing-feature
) - Abrir una solicitud de extracción
Estándares de codificación
- Siga las mejores prácticas de TypeScript
- Mantener la cobertura de pruebas por encima del 80%
- Documentar nuevas funciones y API
- Actualice CHANGELOG.md para cambios significativos
- Seguir el versionado semántico
Consideraciones de rendimiento
- Utilice operaciones por lotes siempre que sea posible
- Implementar un manejo adecuado de errores y reintentos
- Considere el uso de memoria con grandes conjuntos de datos
- Almacenar en caché los resultados cuando sea apropiado
- Utilice la transmisión para contenido de gran tamaño
Requisitos
- Node.js >= 18
- Dramaturgo (instalado automáticamente como dependencia)
Plataformas verificadas
- [x] macOS
- [x] Ventanas
- [ ] Linux
Licencia
Instituto Tecnológico de Massachusetts (MIT)
Créditos
Este proyecto se basa en el excelente trabajo de mcp-webresearch de mzxrai . El código base original sentó las bases para nuestras funciones y capacidades mejoradas.
Autor
You must be authenticated.
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
El servidor de investigación web MCP permite la investigación web en tiempo real con Claude integrando la búsqueda de Google, capturando contenido de páginas web y capturas de pantalla, y rastreando sesiones de investigación.
- Últimos cambios
- Características
- Prerrequisitos
- Instalación
- Uso
- Opciones de configuración
- Manejo de errores
- Desarrollo
- Contribuyendo
- Requisitos
- Plataformas verificadas
- Licencia
- Créditos
- Autor
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server for web research. Bring real-time info into Claude and easily research any topic.Last updated -3854189JavaScriptMIT License
Kagi MCP Serverofficial
AsecurityAlicenseAqualityAn MCP server that integrates Kagi search capabilities with Claude AI, enabling Claude to perform real-time web searches when answering questions that require up-to-date information.Last updated -193PythonMIT License- -securityAlicense-qualityA Model Context Protocol server that enables Claude to perform web research by integrating Google search, extracting webpage content, and capturing screenshots in real-time.Last updated -8541JavaScriptMIT License
- -securityAlicense-qualityA server that integrates with Claude Desktop to enable real-time web research capabilities, allowing users to search Google, extract webpage content, and capture screenshots directly from conversations.Last updated -854MIT License