Skip to main content
Glama

PyAutoGUI MCP Server

servidor mcp-pyautogui

Un servidor MCP (Protocolo de contexto de modelo) que proporciona capacidades de control y pruebas de GUI automatizadas a través de PyAutoGUI.

Características

  • Controlar los movimientos y clics del ratón
  • Simular la entrada del teclado
  • Tomar capturas de pantalla
  • Buscar imágenes en la pantalla
  • Obtener información de la pantalla
  • Compatibilidad multiplataforma (Windows, macOS, Linux)

Herramientas

El servidor implementa las siguientes herramientas:

Control del ratón

  • Mueva el ratón a coordenadas específicas
  • Haga clic en la posición actual o especificada
  • Operaciones de arrastrar y soltar
  • Obtener la posición actual del mouse

Control del teclado

  • Escribe texto
  • Presione teclas individuales
  • Combinaciones de teclas de acceso rápido

Operaciones de pantalla

  • Tomar capturas de pantalla
  • Obtener el tamaño de la pantalla
  • Buscar ubicaciones de imágenes en la pantalla
  • Obtener colores de píxeles

Instalación

Prerrequisitos

  • Python 3.12+
  • PyAutoGUI
  • Otras dependencias se instalarán automáticamente

Pasos de instalación

Instalar el paquete:

pip install mcp-pyautogui-server

Configuración del escritorio de Claude

En MacOS:

~/Library/Application\ Support/Claude/claude_desktop_config.json

En Windows:

%APPDATA%/Claude/claude_desktop_config.json

Configuración de servidores de desarrollo/no publicados:

{ "mcpServers": { "mcp-pyautogui-server": { "command": "uv", "args": [ "--directory", "/path/to/mcp-pyautogui-server", "run", "mcp-pyautogui-server" ] } } }

Configuración de servidores publicados:

{ "mcpServers": { "mcp-pyautogui-server": { "command": "uvx", "args": [ "mcp-pyautogui-server" ] } } }

Desarrollo

Construcción y publicación

  1. Sincronizar dependencias y actualizar el archivo de bloqueo:
uv sync
  1. Distribuciones de paquetes de compilación:
uv build
  1. Publicar en PyPI:
uv publish

Nota: Establezca las credenciales de PyPI a través de variables de entorno o indicadores de comando:

  • Token: --token o UV_PUBLISH_TOKEN
  • Nombre de usuario/contraseña: --username / UV_PUBLISH_USERNAME y --password / UV_PUBLISH_PASSWORD

Depuración

Para obtener la mejor experiencia de depuración, utilice el Inspector MCP.

Inicie el Inspector MCP a través de npm:

npx @modelcontextprotocol/inspector uv --directory /path/to/mcp-pyautogui-server run mcp-pyautogui-server

El Inspector mostrará una URL a la que podrá acceder en su navegador para comenzar a depurar.

Licencia

Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Proporciona capacidades de control y pruebas de GUI automatizadas a través de un servidor MCP que permite movimientos del mouse, entrada de teclado, capturas de pantalla y reconocimiento de imágenes en Windows, macOS y Linux.

  1. Características
    1. Herramientas
      1. Control del ratón
      2. Control del teclado
      3. Operaciones de pantalla
    2. Instalación
      1. Prerrequisitos
      2. Pasos de instalación
      3. Configuración del escritorio de Claude
    3. Desarrollo
      1. Construcción y publicación
      2. Depuración
    4. Licencia

      Related MCP Servers

      • -
        security
        A
        license
        -
        quality
        A MCP server that provides browser automation tools, allowing users to navigate websites, take screenshots, click elements, fill forms, and execute JavaScript through Playwright.
        Last updated -
        Python
        Apache 2.0
        • Apple
      • A
        security
        A
        license
        A
        quality
        Simple MCP Server to enable a human-in-the-loop workflow in tools like Cline and Cursor. This is especially useful for developing desktop applications that require complex user interactions to test.
        Last updated -
        1
        13
        Python
        MIT License
        • Linux
        • Apple
      • A
        security
        A
        license
        A
        quality
        The first open-source MCP server that enables AI to fully control remote macOS systems.
        Last updated -
        6
        125
        Python
        MIT License
        • Apple
      • -
        security
        A
        license
        -
        quality
        An MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.
        Last updated -
        Python
        MIT License
        • Apple
        • Linux

      View all related MCP servers

      MCP directory API

      We provide all the information about MCP servers via our MCP API.

      curl -X GET 'https://glama.ai/api/mcp/v1/servers/hetaoBackend/mcp-pyautogui-server'

      If you have feedback or need assistance with the MCP directory API, please join our Discord server