Skip to main content
Glama

MCP Puppeteer Linux Server

MCP-Puppeteer-Linux

Un servidor de Protocolo de Contexto de Modelo (MLP) que proporciona funciones de automatización de navegadores mediante Puppeteer, con compatibilidad total con servidores de visualización Linux (X11 y Wayland). Este servidor permite a los LLM interactuar con páginas web, tomar capturas de pantalla y ejecutar JavaScript en un entorno de navegador real.

Soporte para servidores de visualización

Esta bifurcación agrega detección y configuración automáticas para servidores de visualización Linux:

  • Detección automática de X11/Wayland
  • Configuración de variables de entorno dinámicas
  • Soporte para varios entornos de escritorio (GNOME, KDE, etc.)
  • Mecanismos de respaldo y manejo robusto de errores
  • Compatibilidad con XWayland

Componentes

Herramientas

  • titiritero_navegar
    • Navegue a cualquier URL en el navegador
    • Entrada: url (cadena)
  • captura de pantalla del titiritero
    • Capturar capturas de pantalla de toda la página o de elementos específicos
    • Entradas:
      • name (cadena, obligatorio): nombre para la captura de pantalla
      • selector (cadena, opcional): selector CSS para el elemento que se va a capturar en captura de pantalla
      • width (número, opcional, predeterminado: 800): Ancho de captura de pantalla
      • height (número, opcional, predeterminado: 600): altura de la captura de pantalla
  • clic del titiritero
    • Haga clic en elementos de la página
    • Entrada: selector (cadena): selector CSS para el elemento en el que hacer clic
  • titiritero_flotante
    • Elementos flotantes en la página
    • Entrada: selector (cadena): selector CSS para el elemento sobre el que se pasará el cursor
  • relleno de titiritero
    • Rellene los campos de entrada
    • Entradas:
      • selector (cadena): selector CSS para el campo de entrada
      • value (cadena): Valor a rellenar
  • titiritero_seleccionar
    • Seleccione un elemento con la etiqueta SELECT
    • Entradas:
      • selector (cadena): selector CSS para el elemento a seleccionar
      • value (cadena): Valor a seleccionar
  • titiritero_evaluar
    • Ejecutar JavaScript en la consola del navegador
    • Entrada: script (cadena): código JavaScript a ejecutar

Recursos

El servidor proporciona acceso a dos tipos de recursos:

  1. Registros de la consola ( console://logs )
    • Salida de la consola del navegador en formato de texto
    • Incluye todos los mensajes de la consola del navegador.
  2. Capturas de pantalla ( screenshot://<name> )
    • Imágenes PNG de capturas de pantalla
    • Accesible a través del nombre de captura de pantalla especificado durante la captura

Características principales

  • Automatización del navegador con compatibilidad con servidores de visualización Linux
  • Detección y configuración automática de X11/Wayland
  • Monitoreo de registros de la consola
  • Capacidades de captura de pantalla
  • Ejecución de JavaScript
  • Interacción web básica (navegación, clics, llenado de formularios)

Configuración

Configuración del escritorio de Claude

{ "mcpServers": { "puppeteer": { "command": "npx", "args": ["ts-node", "/path/to/index.ts"] } } }

Instalación

Instalación mediante herrería

Para instalar Puppeteer Linux para Claude Desktop automáticamente a través de Smithery :

npx -y @smithery/cli install @PhialsBasement/mcp-puppeteer-linux --client claude

Instalación manual

  1. Clonar el repositorio:
git clone https://github.com/PhialsBasement/MCP-Puppeteer-Linux.git
  1. Instalar dependencias:
npm install
  1. Iniciar el servidor:
ts-node index.ts

Detalles del servidor de visualización

El servidor detecta y configura automáticamente el entorno de visualización adecuado:

Soporte de Wayland

  • Detecta sesiones de Wayland a través de WAYLAND_DISPLAY
  • Configura las variables de entorno necesarias:
    • WAYLAND_DISPLAY
    • QT_QPA_PLATFORM
    • GDK_BACKEND
    • MOZ_ENABLE_WAYLAND
    • XDG_SESSION_TYPE

Compatibilidad con X11

  • Respaldo para sesiones tradicionales de X11
  • Maneja variables específicas de X11:
    • DISPLAY
    • XAUTHORITY
  • Admite varios entornos de escritorio y administradores de ventanas.

Licencia

Este servidor MCP cuenta con la licencia MIT. Esto significa que puede usar, modificar y distribuir el software libremente, sujeto a los términos y condiciones de la licencia MIT. Para más detalles, consulte el archivo de LICENCIA en el repositorio del proyecto.

You must be authenticated.

A
security – no known vulnerabilities
F
license - not found
A
quality - confirmed to work

local-only server

The server can only run on the client's local machine because it depends on local resources.

Permite la automatización del navegador para LLM en servidores de visualización Linux, lo que admite interacción web, capturas de pantalla y ejecución de JavaScript en un navegador real.

  1. Soporte para servidores de visualización
    1. Componentes
      1. Herramientas
      2. Recursos
    2. Características principales
      1. Configuración
        1. Configuración del escritorio de Claude
      2. Instalación
        1. Instalación mediante herrería
        2. Instalación manual
      3. Detalles del servidor de visualización
        1. Soporte de Wayland
        2. Compatibilidad con X11
      4. Licencia

        Related MCP Servers

        • A
          security
          A
          license
          A
          quality
          Enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a real browser environment
          Last updated -
          10
          327
          85
          JavaScript
          MIT License
          • Apple
        • A
          security
          A
          license
          A
          quality
          This server provides cloud browser automation capabilities using Browserbase, Puppeteer, and Stagehand. This server enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a cloud browser environment.
          Last updated -
          8
          502
          1,788
          TypeScript
          Apache 2.0
        • A
          security
          F
          license
          A
          quality
          A server that enables browser automation using Playwright, allowing interaction with web pages, capturing screenshots, and executing JavaScript in a browser environment through LLMs.
          Last updated -
          12
          9,457
          1
          TypeScript
        • A
          security
          F
          license
          A
          quality
          Enables LLMs to perform web browsing tasks, take screenshots, and execute JavaScript using Puppeteer for browser automation.
          Last updated -
          4
          15,502
          1
          JavaScript

        View all related MCP servers

        MCP directory API

        We provide all the information about MCP servers via our MCP API.

        curl -X GET 'https://glama.ai/api/mcp/v1/servers/PhialsBasement/MCP-Puppeteer-Linux'

        If you have feedback or need assistance with the MCP directory API, please join our Discord server