Scrapling Fetch MCP
Un servidor MCP que ayuda a los asistentes de IA a acceder al contenido de texto de sitios web que implementan la detección de bots, reduciendo la brecha entre lo que puede ver en su navegador y lo que la IA puede acceder.
Uso previsto
Esta herramienta está optimizada para la recuperación de documentación y materiales de referencia de bajo volumen (solo texto/HTML) de sitios web que implementan la detección de bots. No se ha diseñado ni probado para el scraping de sitios web ni la recolección de datos de uso general.
Nota : Este proyecto fue desarrollado en colaboración con Claude Sonnet 3.7, utilizando LLM Context .
Instalación
Requisitos:
Python 3.10+
administrador de paquetes uv
Instalar dependencias y la herramienta:
Configuración con Claude
Agregue esta configuración a la configuración del servidor MCP de su cliente Claude:
Herramientas disponibles
Este paquete proporciona dos herramientas distintas:
s-fetch-page : recupera páginas web completas con soporte de paginación
s-fetch-pattern : extrae contenido que coincide con los patrones de expresiones regulares con el contexto circundante
Ejemplo de uso
Obtener una página completa
Extracción de contenido específico con coincidencia de patrones
Opciones de funcionalidad
Niveles de protección :
basic: recuperación rápida (1-2 segundos) pero menor éxito con sitios altamente protegidosstealth: protección equilibrada (3-8 segundos) que funciona con la mayoría de los sitiosmax-stealth: Máxima protección (más de 10 segundos) para sitios altamente protegidos
Opciones de segmentación de contenido :
s-fetch-page : recupera páginas completas con soporte de paginación (usando
start_indexymax_length)s-fetch-pattern : Extrae contenido específico usando expresiones regulares (con
search_patternycontext_chars)Los resultados incluyen información de posición para consultas de seguimiento con
s-fetch-page
Consejos para obtener los mejores resultados
Comience con el modo
basicy solo escale a niveles de protección más altos si es necesarioPara documentos grandes, utilice los parámetros de paginación con
s-fetch-pageUtilice
s-fetch-patterncuando busque información específica en páginas grandesLa IA ajustará automáticamente su enfoque en función del nivel de protección del sitio.
Limitaciones
Diseñado únicamente para contenido de texto : específicamente para documentación, artículos y materiales de referencia.
No está diseñado para el raspado o la recolección de datos de gran volumen.
Puede que no funcione con sitios que requieren autenticación
El rendimiento varía según la complejidad del sitio
Licencia
Apache 2
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Un servidor MCP que ayuda a los asistentes de IA a acceder al contenido de texto de sitios web que implementan la detección de bots, reduciendo la brecha entre lo que puede ver en su navegador y lo que la IA puede acceder.
Related MCP Servers
- -security-license-qualityMCP server that enables AI assistants to perform SEO automation tasks including keyword research, SERP analysis, and competitor analysis through Google Ads API integration.Last updated -1
- -security-license-qualityAn MCP server that enables AI assistants to control a web browser through natural language commands, allowing them to navigate websites and extract information via SSE transport.Last updated -765MIT License
- -security-license-qualityA MCP server that allows AI assistants to interact with the browser, including getting page content as markdown, modifying page styles, and searching browser history.Last updated -82
- Asecurity-licenseAqualityAn MCP server that provides AI assistants with powerful tools to interact with YouTube, including video searching, transcript extraction, comment retrieval, and more.Last updated -820