Scrapling Fetch MCP

Licencia Versión de PyPI

Un servidor MCP que ayuda a los asistentes de IA a acceder al contenido de texto de sitios web que implementan la detección de bots, reduciendo la brecha entre lo que puede ver en su navegador y lo que la IA puede acceder.

Uso previsto

Esta herramienta está optimizada para la recuperación de documentación y materiales de referencia de bajo volumen (solo texto/HTML) de sitios web que implementan la detección de bots. No se ha diseñado ni probado para el scraping de sitios web ni la recolección de datos de uso general.

Nota : Este proyecto fue desarrollado en colaboración con Claude Sonnet 3.7, utilizando LLM Context .

Related MCP server: browser-use MCP Server

Instalación

Requisitos:
- Python 3.10+
- administrador de paquetes uv
Instalar dependencias y la herramienta:

uv tool install scrapling scrapling install uv tool install scrapling-fetch-mcp

Configuración con Claude

Agregue esta configuración a la configuración del servidor MCP de su cliente Claude:

{ "mcpServers": { "Cyber-Chitta": { "command": "uvx", "args": ["scrapling-fetch-mcp"] } } }

Herramientas disponibles

Este paquete proporciona dos herramientas distintas:

s-fetch-page : recupera páginas web completas con soporte de paginación
s-fetch-pattern : extrae contenido que coincide con los patrones de expresiones regulares con el contexto circundante

Ejemplo de uso

Obtener una página completa

Human: Please fetch and summarize the documentation at https://example.com/docs Claude: I'll help you with that. Let me fetch the documentation. <mcp:function_calls> <mcp:invoke name="s-fetch-page"> <mcp:parameter name="url">https://example.com/docs</mcp:parameter> <mcp:parameter name="mode">basic</mcp:parameter> </mcp:invoke> </mcp:function_calls> Based on the documentation I retrieved, here's a summary...

Extracción de contenido específico con coincidencia de patrones

Human: Please find all mentions of "API keys" on the documentation page. Claude: I'll search for that specific information. <mcp:function_calls> <mcp:invoke name="s-fetch-pattern"> <mcp:parameter name="url">https://example.com/docs</mcp:parameter> <mcp:parameter name="mode">basic</mcp:parameter> <mcp:parameter name="search_pattern">API\s+keys?</mcp:parameter> <mcp:parameter name="context_chars">150</mcp:parameter> </mcp:invoke> </mcp:function_calls> I found several mentions of API keys in the documentation: ...

Opciones de funcionalidad

Niveles de protección :
- basic : recuperación rápida (1-2 segundos) pero menor éxito con sitios altamente protegidos
- stealth : protección equilibrada (3-8 segundos) que funciona con la mayoría de los sitios
- max-stealth : Máxima protección (más de 10 segundos) para sitios altamente protegidos
Opciones de segmentación de contenido :
- s-fetch-page : recupera páginas completas con soporte de paginación (usando start_index y max_length )
- s-fetch-pattern : Extrae contenido específico usando expresiones regulares (con search_pattern y context_chars )
  - Los resultados incluyen información de posición para consultas de seguimiento con s-fetch-page

Consejos para obtener los mejores resultados

Comience con el modo basic y solo escale a niveles de protección más altos si es necesario
Para documentos grandes, utilice los parámetros de paginación con s-fetch-page
Utilice s-fetch-pattern cuando busque información específica en páginas grandes
La IA ajustará automáticamente su enfoque en función del nivel de protección del sitio.

Limitaciones

Diseñado únicamente para contenido de texto : específicamente para documentación, artículos y materiales de referencia.
No está diseñado para el raspado o la recolección de datos de gran volumen.
Puede que no funcione con sitios que requieren autenticación
El rendimiento varía según la complejidad del sitio