Skip to main content
Glama

Scraper.is MCP Server

by Ai-Quill
MIT License
1,379
4
  • Apple
  • Linux

Scraper.is MCP

Una integración del Protocolo de Contexto de Modelo (MCP) para Scraper.is : una poderosa herramienta de raspado web para asistentes de IA.

Este paquete permite a los asistentes de IA extraer contenido web a través del protocolo MCP, lo que les permite acceder a información actualizada de la web.

Características

  • 🌐 Web Scraping : Extrae contenido de cualquier sitio web
  • 📸 Capturas de pantalla : captura representaciones visuales de páginas web
  • 📄 Múltiples formatos : Obtenga contenido en formato Markdown, HTML o JSON
  • 🔄 Actualizaciones de progreso : informes de progreso en tiempo real durante las operaciones de raspado
  • 🔌 Integración con MCP : Integración perfecta con asistentes de IA compatibles con MCP

Instalación

npm install -g scraperis-mcp

O con hilo:

yarn global add scraperis-mcp

Prerrequisitos

Necesita una clave API Scraper.is para usar este paquete.

Obtener su clave API

  1. Regístrate o inicia sesión en scraper.is
  2. Vaya a la sección Claves API en su panel de control: https://www.scraper.is/dashboard/apikeys
  3. Cree una nueva clave API o copie su clave existente
  4. Guarde esta clave de forma segura, ya que la necesitará para usar este paquete.

Uso

Configuración del entorno

Crea un archivo .env con tu clave API de Scraper.is:

SCRAPERIS_API_KEY=your_api_key_here

Integración de escritorio de Claude

Para utilizar este paquete con Claude Desktop:

  1. Instalar el paquete globalmente:
    npm install -g scraperis-mcp
  2. Agregue la siguiente configuración a su archivo claude_desktop_config.json :
    { "mcpServers": { "scraperis_scraper": { "command": "scraperis-mcp", "args": [], "env": { "SCRAPERIS_API_KEY": "your-api-key-here", "DEBUG": "*" } } } }
  3. Reemplace your-api-key-here con su clave API de Scraper.is real.
  4. Reinicie Claude Desktop para aplicar los cambios.

Ejecutando con MCP Inspector

Para el desarrollo y las pruebas, puede utilizar el Inspector MCP:

npx @modelcontextprotocol/inspector scraperis-mcp

Integración con asistentes de IA

Este paquete está diseñado para usarse con asistentes de IA compatibles con el Protocolo de Contexto de Modelo (MCP). Una vez configurado correctamente, el asistente de IA puede usar las siguientes herramientas:

Herramienta de raspado

La herramienta scrape permite a la IA extraer contenido de sitios web. Admite varios formatos:

  • markdown : Devuelve el contenido en formato markdown
  • html : Devuelve el contenido en formato HTML
  • screenshot : Devuelve una captura de pantalla de la página web
  • json : Devuelve datos estructurados en formato JSON

Ejemplo de mensaje para la IA:

Can you scrape the latest news from techcrunch.com and summarize it for me?

Referencia de API

Herramientas

raspar

Extrae contenido de una página web basándose en una solicitud.

Parámetros:

  • prompt (cadena): El mensaje que describe qué raspar, incluida la URL
  • format (cadena): el formato en el que se devolverá el contenido ( markdown , html , screenshot , json , quick )

Ejemplo:

{ "prompt": "Get me the top 10 products from producthunt.com", "format": "markdown" }

Desarrollo

Configuración

  1. Clonar el repositorio:
    git clone https://github.com/Ai-Quill/scraperis-mcp.git cd scraperis-mcp
  2. Instalar dependencias:
    npm install
  3. Construir el proyecto:
    npm run build

Guiones

  • npm run build : Construye el proyecto
  • npm run watch : vigila los cambios y reconstruye
  • npm run dev : Ejecutar con MCP Inspector para desarrollo
  • npm run test : Ejecutar pruebas
  • npm run lint : Ejecutar ESLint

Contribuyendo

¡Agradecemos sus contribuciones! No dude en enviar una solicitud de incorporación de cambios.

Licencia

Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.

Expresiones de gratitud

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Permite extraer datos de sitios web mediante indicaciones en lenguaje natural, lo que permite a los usuarios especificar exactamente qué contenido desean en inglés simple y devolver datos JSON estructurados.

  1. Características
    1. Instalación
      1. Prerrequisitos
        1. Obtener su clave API
      2. Uso
        1. Configuración del entorno
        2. Integración de escritorio de Claude
        3. Ejecutando con MCP Inspector
        4. Integración con asistentes de IA
      3. Referencia de API
        1. Herramientas
      4. Desarrollo
        1. Configuración
        2. Guiones
      5. Contribuyendo
        1. Licencia
          1. Expresiones de gratitud

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              Enables web content scanning and analysis by fetching, analyzing, and extracting information from web pages using tools like page fetching, link extraction, site crawling, and more.
              Last updated -
              6
              7
              TypeScript
              MIT License
            • A
              security
              A
              license
              A
              quality
              Provides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.
              Last updated -
              4
              125,855
              353
              TypeScript
              MIT License
            • -
              security
              F
              license
              -
              quality
              Provides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.
              Last updated -
              125,855
              1
            • -
              security
              -
              license
              -
              quality
              Provides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown with support for custom headers.
              Last updated -
              125,855
              TypeScript

            View all related MCP servers

            MCP directory API

            We provide all the information about MCP servers via our MCP API.

            curl -X GET 'https://glama.ai/api/mcp/v1/servers/Ai-Quill/scraperis-mcp'

            If you have feedback or need assistance with the MCP directory API, please join our Discord server