Scraper.is MCP
Una integración del Protocolo de Contexto de Modelo (MCP) para Scraper.is : una poderosa herramienta de raspado web para asistentes de IA.
Este paquete permite a los asistentes de IA extraer contenido web a través del protocolo MCP, lo que les permite acceder a información actualizada de la web.
Características
🌐 Web Scraping : Extrae contenido de cualquier sitio web
📸 Capturas de pantalla : captura representaciones visuales de páginas web
📄 Múltiples formatos : Obtenga contenido en formato Markdown, HTML o JSON
🔄 Actualizaciones de progreso : informes de progreso en tiempo real durante las operaciones de raspado
🔌 Integración con MCP : Integración perfecta con asistentes de IA compatibles con MCP
Instalación
O con hilo:
Prerrequisitos
Necesita una clave API Scraper.is para usar este paquete.
Obtener su clave API
Regístrate o inicia sesión en scraper.is
Vaya a la sección Claves API en su panel de control: https://www.scraper.is/dashboard/apikeys
Cree una nueva clave API o copie su clave existente
Guarde esta clave de forma segura, ya que la necesitará para usar este paquete.
Uso
Configuración del entorno
Crea un archivo .env con tu clave API de Scraper.is:
Integración de escritorio de Claude
Para utilizar este paquete con Claude Desktop:
Instalar el paquete globalmente:
npm install -g scraperis-mcpAgregue la siguiente configuración a su archivo
claude_desktop_config.json:{ "mcpServers": { "scraperis_scraper": { "command": "scraperis-mcp", "args": [], "env": { "SCRAPERIS_API_KEY": "your-api-key-here", "DEBUG": "*" } } } }Reemplace
your-api-key-herecon su clave API de Scraper.is real.Reinicie Claude Desktop para aplicar los cambios.
Ejecutando con MCP Inspector
Para el desarrollo y las pruebas, puede utilizar el Inspector MCP:
Integración con asistentes de IA
Este paquete está diseñado para usarse con asistentes de IA compatibles con el Protocolo de Contexto de Modelo (MCP). Una vez configurado correctamente, el asistente de IA puede usar las siguientes herramientas:
Herramienta de raspado
La herramienta scrape permite a la IA extraer contenido de sitios web. Admite varios formatos:
markdown: Devuelve el contenido en formato markdownhtml: Devuelve el contenido en formato HTMLscreenshot: Devuelve una captura de pantalla de la página webjson: Devuelve datos estructurados en formato JSON
Ejemplo de mensaje para la IA:
Referencia de API
Herramientas
raspar
Extrae contenido de una página web basándose en una solicitud.
Parámetros:
prompt(cadena): El mensaje que describe qué raspar, incluida la URLformat(cadena): el formato en el que se devolverá el contenido (markdown,html,screenshot,json,quick)
Ejemplo:
Desarrollo
Configuración
Clonar el repositorio:
git clone https://github.com/Ai-Quill/scraperis-mcp.git cd scraperis-mcpInstalar dependencias:
npm installConstruir el proyecto:
npm run build
Guiones
npm run build: Construye el proyectonpm run watch: vigila los cambios y reconstruyenpm run dev: Ejecutar con MCP Inspector para desarrollonpm run test: Ejecutar pruebasnpm run lint: Ejecutar ESLint
Contribuyendo
¡Agradecemos sus contribuciones! No dude en enviar una solicitud de incorporación de cambios.
Licencia
Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.
Expresiones de gratitud
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Permite extraer datos de sitios web mediante indicaciones en lenguaje natural, lo que permite a los usuarios especificar exactamente qué contenido desean en inglés simple y devolver datos JSON estructurados.
- Características
- Instalación
- Prerrequisitos
- Uso
- Referencia de API
- Desarrollo
- Contribuyendo
- Licencia
- Expresiones de gratitud
Related Resources
Related MCP Servers
- Asecurity-licenseAqualityProvides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.Last updated -4376610MIT License
- Asecurity-licenseAqualityProvides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.Last updated -4104,1622
- Asecurity-licenseAqualityProvides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown with support for custom headers.Last updated -4104,1623
- -security-license-qualityExtract structured data from any website with a simple SDK call. No scraping code, no headless browsers - just prompt and get JSON.Last updated -43