PyAutoGUI MCP Server

MIT License
6
  • Apple
  • Linux

Integrations

  • Enables cross-platform GUI automation on Linux systems, allowing control of mouse and keyboard input and screen operations

  • Enables cross-platform GUI automation on macOS systems, allowing control of mouse and keyboard input and screen operations

  • Supports launching the MCP Inspector via npm for debugging the server's operations

servidor mcp-pyautogui

Un servidor MCP (Protocolo de contexto de modelo) que proporciona capacidades de control y pruebas de GUI automatizadas a través de PyAutoGUI.

Características

  • Controlar los movimientos y clics del ratón
  • Simular la entrada del teclado
  • Tomar capturas de pantalla
  • Buscar imágenes en la pantalla
  • Obtener información de la pantalla
  • Compatibilidad multiplataforma (Windows, macOS, Linux)

Herramientas

El servidor implementa las siguientes herramientas:

Control del ratón

  • Mueva el ratón a coordenadas específicas
  • Haga clic en la posición actual o especificada
  • Operaciones de arrastrar y soltar
  • Obtener la posición actual del mouse

Control del teclado

  • Escribe texto
  • Presione teclas individuales
  • Combinaciones de teclas de acceso rápido

Operaciones de pantalla

  • Tomar capturas de pantalla
  • Obtener el tamaño de la pantalla
  • Buscar ubicaciones de imágenes en la pantalla
  • Obtener colores de píxeles

Instalación

Prerrequisitos

  • Python 3.12+
  • PyAutoGUI
  • Otras dependencias se instalarán automáticamente

Pasos de instalación

Instalar el paquete:

pip install mcp-pyautogui-server

Configuración del escritorio de Claude

En MacOS:

~/Library/Application\ Support/Claude/claude_desktop_config.json

En Windows:

%APPDATA%/Claude/claude_desktop_config.json

Configuración de servidores de desarrollo/no publicados:

{ "mcpServers": { "mcp-pyautogui-server": { "command": "uv", "args": [ "--directory", "/path/to/mcp-pyautogui-server", "run", "mcp-pyautogui-server" ] } } }

Configuración de servidores publicados:

{ "mcpServers": { "mcp-pyautogui-server": { "command": "uvx", "args": [ "mcp-pyautogui-server" ] } } }

Desarrollo

Construcción y publicación

  1. Sincronizar dependencias y actualizar el archivo de bloqueo:
uv sync
  1. Distribuciones de paquetes de compilación:
uv build
  1. Publicar en PyPI:
uv publish

Nota: Establezca las credenciales de PyPI a través de variables de entorno o indicadores de comando:

  • Token: --token o UV_PUBLISH_TOKEN
  • Nombre de usuario/contraseña: --username / UV_PUBLISH_USERNAME y --password / UV_PUBLISH_PASSWORD

Depuración

Para obtener la mejor experiencia de depuración, utilice el Inspector MCP.

Inicie el Inspector MCP a través de npm:

npx @modelcontextprotocol/inspector uv --directory /path/to/mcp-pyautogui-server run mcp-pyautogui-server

El Inspector mostrará una URL a la que podrá acceder en su navegador para comenzar a depurar.

Licencia

Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.

-
security - not tested
A
license - permissive license
-
quality - not tested

Proporciona capacidades de control y pruebas de GUI automatizadas a través de un servidor MCP que permite movimientos del mouse, entrada de teclado, capturas de pantalla y reconocimiento de imágenes en Windows, macOS y Linux.

  1. Features
    1. Tools
      1. Mouse Control
      2. Keyboard Control
      3. Screen Operations
    2. Installation
      1. Prerequisites
      2. Install Steps
      3. Claude Desktop Configuration
    3. Development
      1. Building and Publishing
      2. Debugging
    4. License

      Related MCP Servers

      • -
        security
        A
        license
        -
        quality
        A MCP server that provides browser automation tools, allowing users to navigate websites, take screenshots, click elements, fill forms, and execute JavaScript through Playwright.
        Last updated -
        Python
        Apache 2.0
        • Apple
      • A
        security
        A
        license
        A
        quality
        Simple MCP Server to enable a human-in-the-loop workflow in tools like Cline and Cursor. This is especially useful for developing desktop applications that require complex user interactions to test.
        Last updated -
        1
        13
        Python
        MIT License
        • Linux
        • Apple
      • A
        security
        A
        license
        A
        quality
        The first open-source MCP server that enables AI to fully control remote macOS systems.
        Last updated -
        6
        55
        Python
        MIT License
        • Apple
      • -
        security
        A
        license
        -
        quality
        An MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.
        Last updated -
        Python
        MIT License
        • Apple
        • Linux

      View all related MCP servers

      ID: qjvdfenpis