Skip to main content
Glama

PyAutoGUI MCP Server

servidor mcp-pyautogui

Un servidor MCP (Protocolo de contexto de modelo) que proporciona capacidades de control y pruebas de GUI automatizadas a través de PyAutoGUI.

Características

  • Controlar los movimientos y clics del ratón
  • Simular la entrada del teclado
  • Tomar capturas de pantalla
  • Buscar imágenes en la pantalla
  • Obtener información de la pantalla
  • Compatibilidad multiplataforma (Windows, macOS, Linux)

Herramientas

El servidor implementa las siguientes herramientas:

Control del ratón

  • Mueva el ratón a coordenadas específicas
  • Haga clic en la posición actual o especificada
  • Operaciones de arrastrar y soltar
  • Obtener la posición actual del mouse

Control del teclado

  • Escribe texto
  • Presione teclas individuales
  • Combinaciones de teclas de acceso rápido

Operaciones de pantalla

  • Tomar capturas de pantalla
  • Obtener el tamaño de la pantalla
  • Buscar ubicaciones de imágenes en la pantalla
  • Obtener colores de píxeles

Instalación

Prerrequisitos

  • Python 3.12+
  • PyAutoGUI
  • Otras dependencias se instalarán automáticamente

Pasos de instalación

Instalar el paquete:

pip install mcp-pyautogui-server

Configuración del escritorio de Claude

En MacOS:

~/Library/Application\ Support/Claude/claude_desktop_config.json

En Windows:

%APPDATA%/Claude/claude_desktop_config.json

Configuración de servidores de desarrollo/no publicados:

{ "mcpServers": { "mcp-pyautogui-server": { "command": "uv", "args": [ "--directory", "/path/to/mcp-pyautogui-server", "run", "mcp-pyautogui-server" ] } } }

Configuración de servidores publicados:

{ "mcpServers": { "mcp-pyautogui-server": { "command": "uvx", "args": [ "mcp-pyautogui-server" ] } } }

Desarrollo

Construcción y publicación

  1. Sincronizar dependencias y actualizar el archivo de bloqueo:
uv sync
  1. Distribuciones de paquetes de compilación:
uv build
  1. Publicar en PyPI:
uv publish

Nota: Establezca las credenciales de PyPI a través de variables de entorno o indicadores de comando:

  • Token: --token o UV_PUBLISH_TOKEN
  • Nombre de usuario/contraseña: --username / UV_PUBLISH_USERNAME y --password / UV_PUBLISH_PASSWORD

Depuración

Para obtener la mejor experiencia de depuración, utilice el Inspector MCP.

Inicie el Inspector MCP a través de npm:

npx @modelcontextprotocol/inspector uv --directory /path/to/mcp-pyautogui-server run mcp-pyautogui-server

El Inspector mostrará una URL a la que podrá acceder en su navegador para comenzar a depurar.

Licencia

Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Proporciona capacidades de control y pruebas de GUI automatizadas a través de un servidor MCP que permite movimientos del mouse, entrada de teclado, capturas de pantalla y reconocimiento de imágenes en Windows, macOS y Linux.

  1. Características
    1. Herramientas
      1. Control del ratón
      2. Control del teclado
      3. Operaciones de pantalla
    2. Instalación
      1. Prerrequisitos
      2. Pasos de instalación
      3. Configuración del escritorio de Claude
    3. Desarrollo
      1. Construcción y publicación
      2. Depuración
    4. Licencia

      Related MCP Servers

      • -
        security
        A
        license
        -
        quality
        An MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.
        Last updated -
        7
        Python
        MIT License
        • Apple
        • Linux
      • -
        security
        A
        license
        -
        quality
        MCP server that provides computer control capabilities including mouse movements, keyboard actions, screenshot capture with OCR, and window management through a unified API.
        Last updated -
        25
        Python
        MIT License
      • A
        security
        A
        license
        A
        quality
        A powerful MCP server that provides interactive user feedback and command execution capabilities for AI-assisted development, featuring a graphical interface with text and image support.
        Last updated -
        1
        33
        Python
        MIT License
      • -
        security
        F
        license
        -
        quality
        An MCP server that allows AI tools like Claude Desktop, Claude Code, and Cursor to visually interact with macOS applications by capturing screenshots and controlling the mouse and keyboard.
        Last updated -
        2
        TypeScript
        • Apple

      View all related MCP servers

      MCP directory API

      We provide all the information about MCP servers via our MCP API.

      curl -X GET 'https://glama.ai/api/mcp/v1/servers/hetaoBackend/mcp-pyautogui-server'

      If you have feedback or need assistance with the MCP directory API, please join our Discord server