Integrations
Enables cross-platform GUI automation on Linux systems, allowing control of mouse and keyboard input and screen operations
Enables cross-platform GUI automation on macOS systems, allowing control of mouse and keyboard input and screen operations
Supports launching the MCP Inspector via npm for debugging the server's operations
servidor mcp-pyautogui
Un servidor MCP (Protocolo de contexto de modelo) que proporciona capacidades de control y pruebas de GUI automatizadas a través de PyAutoGUI.
Características
- Controlar los movimientos y clics del ratón
- Simular la entrada del teclado
- Tomar capturas de pantalla
- Buscar imágenes en la pantalla
- Obtener información de la pantalla
- Compatibilidad multiplataforma (Windows, macOS, Linux)
Herramientas
El servidor implementa las siguientes herramientas:
Control del ratón
- Mueva el ratón a coordenadas específicas
- Haga clic en la posición actual o especificada
- Operaciones de arrastrar y soltar
- Obtener la posición actual del mouse
Control del teclado
- Escribe texto
- Presione teclas individuales
- Combinaciones de teclas de acceso rápido
Operaciones de pantalla
- Tomar capturas de pantalla
- Obtener el tamaño de la pantalla
- Buscar ubicaciones de imágenes en la pantalla
- Obtener colores de píxeles
Instalación
Prerrequisitos
- Python 3.12+
- PyAutoGUI
- Otras dependencias se instalarán automáticamente
Pasos de instalación
Instalar el paquete:
Configuración del escritorio de Claude
En MacOS:
En Windows:
Configuración de servidores de desarrollo/no publicados:
Configuración de servidores publicados:
Desarrollo
Construcción y publicación
- Sincronizar dependencias y actualizar el archivo de bloqueo:
- Distribuciones de paquetes de compilación:
- Publicar en PyPI:
Nota: Establezca las credenciales de PyPI a través de variables de entorno o indicadores de comando:
- Token:
--token
oUV_PUBLISH_TOKEN
- Nombre de usuario/contraseña:
--username
/UV_PUBLISH_USERNAME
y--password
/UV_PUBLISH_PASSWORD
Depuración
Para obtener la mejor experiencia de depuración, utilice el Inspector MCP.
Inicie el Inspector MCP a través de npm:
El Inspector mostrará una URL a la que podrá acceder en su navegador para comenzar a depurar.
Licencia
Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.
This server cannot be installed
Proporciona capacidades de control y pruebas de GUI automatizadas a través de un servidor MCP que permite movimientos del mouse, entrada de teclado, capturas de pantalla y reconocimiento de imágenes en Windows, macOS y Linux.
Related MCP Servers
- -securityAlicense-qualityA MCP server that provides browser automation tools, allowing users to navigate websites, take screenshots, click elements, fill forms, and execute JavaScript through Playwright.Last updated -PythonApache 2.0
- AsecurityAlicenseAqualitySimple MCP Server to enable a human-in-the-loop workflow in tools like Cline and Cursor. This is especially useful for developing desktop applications that require complex user interactions to test.Last updated -113PythonMIT License
- AsecurityAlicenseAqualityThe first open-source MCP server that enables AI to fully control remote macOS systems.Last updated -655PythonMIT License
- -securityAlicense-qualityAn MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.Last updated -PythonMIT License