Skip to main content
Glama

LionScraper: Servicio MCP + CLI

¿Qué es esto?

LionScraper es una extensión de navegador que permite realizar capturas de listas, artículos, enlaces, imágenes, etc., en páginas web. Este repositorio proporciona el servicio MCP complementario: una vez conectado al software de IA que utilices (por ejemplo, Cursor), podrás pedirle a la IA en el chat que invoque la extensión para realizar la captura, sin tener que hacer clic en cada menú manualmente.

Puedes entenderlo como un "pequeño puente": el software de IA está en un lado, la extensión del navegador en el otro, y este servicio se encarga de transmitir los mensajes. La lógica de captura real se completa en la extensión; este servicio solo actúa como conector y retransmisor.

Preparativos antes de usar

  1. Navegador: Chrome o Edge (según el soporte real de la extensión).

  2. Extensión LionScraper: Instálala y actívala desde la tienda de extensiones del navegador (el nombre puede variar según lo que se muestre en la tienda).

  3. Node.js: El equipo debe tener instalada la versión 18 o superior. Si aún no la tienes, puedes ir al sitio web oficial de Node.js para descargar el instalador y seguir las instrucciones.

  4. Software de IA compatible con MCP: Por ejemplo, Cursor, Trae, etc. (según si cada software admite MCP).

Instalación del servicio MCP (paquete npm)

Este servicio se ha publicado en npm con el nombre de paquete lionscraper. Puedes abrir ese enlace para ver las instrucciones y la información de la versión.

Abre una terminal en tu equipo (en Windows puede ser "Símbolo del sistema" o PowerShell) y ejecuta:

npm install -g lionscraper

Tras una instalación exitosa, el sistema tendrá dos comandos comunes: lionscraper-mcp (para conectar el software de IA a MCP) y lionscraper (CLI de terminal). Ambos dependen del mismo conjunto de demonios locales y puentes de extensión; el PORT (por defecto 13808) debe coincidir con el puerto de puente en la extensión.

Si no deseas realizar una instalación global, también puedes usar npx para descargar y ejecutar temporalmente el servicio en la configuración MCP de tu software de IA (requiere Node.js instalado). Idea de ejemplo: establece el comando de inicio como npx y los parámetros como -y, -p, lionscraper, lionscraper-mcp (consulta la configuración MCP de tu software para ver el formato JSON específico).

CLI (Terminal)

Suponiendo una instalación global, puedes usar lionscraper en la terminal para capturas mediante scripts o usarlo en paralelo con MCP (compartiendo lionscraper daemon y PORT):

  • lionscraper daemon: Ejecución residente; proporciona HTTP (CLI / llamadas MCP ligeras) y WebSocket (conexión de extensión) en el mismo puerto.

  • lionscraper stop: Detiene el demonio en el puerto configurado actualmente.

  • lionscraper ping: Comprueba si la extensión se ha registrado en el puente (sin pasar por el chat MCP).

  • lionscraper scrape: Inicia una captura; puedes usar --method para seleccionar modos como lista/cuerpo/correo/teléfono/enlace/imagen, etc., correspondientes a las capacidades de las herramientas MCP.

Ejemplo:

lionscraper daemon
lionscraper ping
lionscraper scrape -u https://www.example.com

Para obtener una descripción más completa de los parámetros, múltiples URL, paginación y filtrado, consulta packages/node/README_cn.md en este repositorio; la versión en inglés es idéntica a la página de presentación en npm, consulta el paquete lionscraper en npm.

Añadir MCP al software de IA

Los siguientes ejemplos asumen una instalación global (la interfaz del software puede variar). En MCP, los valores de env deben ser cadenas de texto.

Configuración simple (cuando no se escribe env, el PORT por defecto es 13808, debe coincidir con el puerto de puente de la extensión):

{
  "mcpServers": {
    "lionscraper": {
      "command": "lionscraper-mcp"
    }
  }
}

Configuración detallada (puedes eliminar claves según sea necesario; una cadena vacía es similar a omitir la clave):

{
  "mcpServers": {
    "lionscraper": {
      "command": "lionscraper-mcp",
      "env": {
        "PORT": "13808",
        "TIMEOUT": "120000",
        "LANG": "zh-CN",
        "TOKEN": "",
        "DAEMON": ""
      }
    }
  }
}
  • PORT: Puerto de escucha HTTP + WebSocket, por defecto 13808, debe coincidir con el puerto de puente de la extensión.

  • TIMEOUT: Milisegundos de espera para que la instancia anterior se cierre al tomar el control del puerto, por defecto 120000; 0 significa forzar el control lo antes posible.

  • LANG: Idioma de la descripción de la herramienta y los registros stderr (por ejemplo, zh-CN, en-US).

  • TOKEN: Bearer consistente con el demonio; dejar vacío significa sin autenticación.

  • DAEMON: Solo 0 prohíbe que el MCP ligero inicie automáticamente el demonio; dejar vacío u otro valor es igual a omitir.

Después de guardar la configuración, reinicia el MCP o el software según lo requiera el programa para que la nueva configuración surta efecto.

Alinear el puerto en la extensión del navegador

  1. Abre la página de configuración u opciones de LionScraper.

  2. Busca el puerto de puente (o nombre similar) y configúralo con el mismo número que el PORT en la configuración MCP del paso anterior (por ejemplo, 13808).

  3. Si has cambiado el puerto o la conexión es anormal, puedes usar "Reconectar" en la extensión; si sigue sin funcionar, intenta recargar la extensión o reiniciar el navegador.

¿Cómo usarlo en el día a día?

  1. Mantén la extensión activada y asegúrate de que la página que deseas capturar esté abierta en el navegador (o sigue las instrucciones de la extensión).

  2. Explica tus necesidades en lenguaje natural en el chat de la IA, por ejemplo:

    • "Primero comprueba si la extensión LionScraper está conectada."

    • "Ayúdame a capturar los datos de la lista / cuerpo del artículo / correo electrónico / teléfono / enlace / imagen en esta página web."

  3. La IA invocará la extensión a través de MCP; si indica que no está conectada o hay tiempo de espera, puedes pedirle a la IA que realice otra comprobación de conexión y confirmar que el puerto coincide y la extensión está abierta.

Preguntas frecuentes

P: ¿Aparece un mensaje de que la extensión no está conectada o la captura falló?

  • ¿Está la extensión abierta y no deshabilitada?

  • ¿El puerto configurado en la IA y el puerto de puente en la extensión son exactamente iguales?

  • En el mismo equipo, generalmente solo se necesita un conjunto de este servicio y puente de extensión en segundo plano; si tienes varias configuraciones MCP abiertas o instalaciones duplicadas, puede causar conflictos.

P: ¿Si ya puedo ver muchas "herramientas" en la IA, significa que ya está conectado?

No necesariamente. Ver las herramientas solo significa que la conexión IA a este servicio funciona; la extensión también debe conectarse al mismo puerto y completar el registro.

Registro MCP y directorios de terceros

Este repositorio está registrado en el Registro MCP oficial como paquete doble (los nombres de archivo de metadatos son server.json):

Directorio

Nombre en el Registro

Descripción

packages/node/server.json

io.github.dowant/lionscraper-node

Corresponde al paquete npm lionscraper, package.json contiene el campo de validación mcpName

packages/python/server.json

io.github.dowant/lionscraper-python

Corresponde al paquete PyPI lionscraper, el README.md en inglés contiene el comentario mcp-name necesario para la descripción en PyPI

Resumen de pasos para publicar en el Registro (requiere tener instalado el CLI oficial, ver Quickstart):

  1. Publica en npm / PyPI la versión que coincida con la version en cada server.json (el ejemplo actual es 1.0.3).

  2. En la raíz del repositorio, entra en packages/node, ejecuta mcp-publisher login github (solo una vez) y luego mcp-publisher publish.

  3. Entra en packages/python y ejecuta mcp-publisher publish de la misma manera (puedes reutilizar el inicio de sesión).

Los directorios de terceros no tienen una entrada unificada; las prácticas comunes incluyen: usar Add Server en Glama para enviar según el proceso del sitio; Smithery está orientado principalmente a HTTPS público + HTTP transmitible, lo cual es diferente de la forma de este repositorio basada principalmente en stdio + instalación npm/pip, por lo que se requiere una solución de alojamiento separada antes de considerarlo.

Licencia

MIT (consistente con la declaración del paquete npm lionscraper).

Install Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - A tier

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/dowant/lionscraper-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server