Skip to main content
Glama

Scrapling Fetch MCP

by cyberchitta

Scrapling Fetch MCP

Un servidor MCP que ayuda a los asistentes de IA a acceder al contenido de texto de sitios web que implementan la detección de bots, reduciendo la brecha entre lo que puede ver en su navegador y lo que la IA puede acceder.

Uso previsto

Esta herramienta está optimizada para la recuperación de documentación y materiales de referencia de bajo volumen (solo texto/HTML) de sitios web que implementan la detección de bots. No se ha diseñado ni probado para el scraping de sitios web ni la recolección de datos de uso general.

Nota : Este proyecto fue desarrollado en colaboración con Claude Sonnet 3.7, utilizando LLM Context .

Instalación

  1. Requisitos:
    • Python 3.10+
    • administrador de paquetes uv
  2. Instalar dependencias y la herramienta:
uv tool install scrapling scrapling install uv tool install scrapling-fetch-mcp

Configuración con Claude

Agregue esta configuración a la configuración del servidor MCP de su cliente Claude:

{ "mcpServers": { "Cyber-Chitta": { "command": "uvx", "args": ["scrapling-fetch-mcp"] } } }

Herramientas disponibles

Este paquete proporciona dos herramientas distintas:

  1. s-fetch-page : recupera páginas web completas con soporte de paginación
  2. s-fetch-pattern : extrae contenido que coincide con los patrones de expresiones regulares con el contexto circundante

Ejemplo de uso

Obtener una página completa

Human: Please fetch and summarize the documentation at https://example.com/docs Claude: I'll help you with that. Let me fetch the documentation. <mcp:function_calls> <mcp:invoke name="s-fetch-page"> <mcp:parameter name="url">https://example.com/docs</mcp:parameter> <mcp:parameter name="mode">basic</mcp:parameter> </mcp:invoke> </mcp:function_calls> Based on the documentation I retrieved, here's a summary...

Extracción de contenido específico con coincidencia de patrones

Human: Please find all mentions of "API keys" on the documentation page. Claude: I'll search for that specific information. <mcp:function_calls> <mcp:invoke name="s-fetch-pattern"> <mcp:parameter name="url">https://example.com/docs</mcp:parameter> <mcp:parameter name="mode">basic</mcp:parameter> <mcp:parameter name="search_pattern">API\s+keys?</mcp:parameter> <mcp:parameter name="context_chars">150</mcp:parameter> </mcp:invoke> </mcp:function_calls> I found several mentions of API keys in the documentation: ...

Opciones de funcionalidad

  • Niveles de protección :
    • basic : recuperación rápida (1-2 segundos) pero menor éxito con sitios altamente protegidos
    • stealth : protección equilibrada (3-8 segundos) que funciona con la mayoría de los sitios
    • max-stealth : Máxima protección (más de 10 segundos) para sitios altamente protegidos
  • Opciones de segmentación de contenido :
    • s-fetch-page : recupera páginas completas con soporte de paginación (usando start_index y max_length )
    • s-fetch-pattern : Extrae contenido específico usando expresiones regulares (con search_pattern y context_chars )
      • Los resultados incluyen información de posición para consultas de seguimiento con s-fetch-page

Consejos para obtener los mejores resultados

  • Comience con el modo basic y solo escale a niveles de protección más altos si es necesario
  • Para documentos grandes, utilice los parámetros de paginación con s-fetch-page
  • Utilice s-fetch-pattern cuando busque información específica en páginas grandes
  • La IA ajustará automáticamente su enfoque en función del nivel de protección del sitio.

Limitaciones

  • Diseñado únicamente para contenido de texto : específicamente para documentación, artículos y materiales de referencia.
  • No está diseñado para el raspado o la recolección de datos de gran volumen.
  • Puede que no funcione con sitios que requieren autenticación
  • El rendimiento varía según la complejidad del sitio

Licencia

Apache 2

-
security - not tested
A
license - permissive license
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Un servidor MCP que ayuda a los asistentes de IA a acceder al contenido de texto de sitios web que implementan la detección de bots, reduciendo la brecha entre lo que puede ver en su navegador y lo que la IA puede acceder.

  1. Uso previsto
    1. Instalación
      1. Configuración con Claude
        1. Herramientas disponibles
          1. Ejemplo de uso
            1. Obtener una página completa
            2. Extracción de contenido específico con coincidencia de patrones
          2. Opciones de funcionalidad
            1. Consejos para obtener los mejores resultados
              1. Limitaciones
                1. Licencia

                  Related MCP Servers

                  • A
                    security
                    A
                    license
                    A
                    quality
                    A headless browser MCP server that allows AI agents to fetch web content and perform Google searches without API keys, supporting various output formats like Markdown, JSON, HTML, and text.
                    Last updated -
                    2
                    4
                    TypeScript
                    MIT License
                  • -
                    security
                    F
                    license
                    -
                    quality
                    A specialized MCP server that enables AI agents to interact with Reddit, including reading posts, creating content, and managing subreddit configurations.
                    Last updated -
                    31
                    5
                    JavaScript
                  • -
                    security
                    F
                    license
                    -
                    quality
                    An MCP server that connects AI assistants to SearchAgora, enabling users to search for, discover, and purchase products across the web through natural language conversations.
                    Last updated -
                    1
                    Python
                    • Apple
                  • -
                    security
                    A
                    license
                    -
                    quality
                    An MCP server that enables AI assistants to control a web browser through natural language commands, allowing them to navigate websites and extract information via SSE transport.
                    Last updated -
                    505
                    Python
                    MIT License
                    • Apple

                  View all related MCP servers

                  MCP directory API

                  We provide all the information about MCP servers via our MCP API.

                  curl -X GET 'https://glama.ai/api/mcp/v1/servers/cyberchitta/scrapling-fetch-mcp'

                  If you have feedback or need assistance with the MCP directory API, please join our Discord server