MCP Windows Desktop Automation

MIT License

Integrations

  • Provides Windows desktop automation capabilities by wrapping the AutoIt library, enabling control of mouse operations, keyboard input, window management, UI controls, processes, and system operations on Windows systems.

  • Implemented with strict TypeScript typing throughout, allowing type-safe development and usage of the MCP server for Windows desktop automation tasks.

Automatización del escritorio de Windows MCP

Un servidor de Protocolo de Contexto de Modelo (MCP) para la automatización del escritorio de Windows mediante AutoIt.

Descripción general

Este proyecto proporciona un servidor MCP de TypeScript que envuelve el paquete node-autoit-koffi , lo que permite que las aplicaciones LLM automaticen las tareas del escritorio de Windows a través del protocolo MCP.

El servidor expone:

  • Herramientas : Todas las funciones de AutoIt son herramientas MCP
  • Recursos : Acceso a archivos y capacidades de captura de pantalla
  • Indicaciones : Plantillas para tareas de automatización comunes

Características

  • Envoltura completa de todas las funciones de AutoIt como herramientas MCP
  • Soporte para transportes stdio y WebSocket
  • Recursos de acceso a archivos para leer archivos y directorios
  • Recursos de captura de pantalla para capturar la pantalla o ventanas específicas
  • Plantillas de indicaciones para tareas de automatización comunes
  • Tipado estricto de TypeScript en todo momento

Instalación

# Clone the repository git clone https://github.com/yourusername/mcp-windows-desktop-automation.git cd mcp-windows-desktop-automation # Install dependencies npm install # Build the project npm run build

Uso

Iniciando el servidor

# Start with stdio transport (default) npm start # Start with WebSocket transport npm start -- --transport=websocket --port=3000 # Enable verbose logging npm start -- --verbose

Opciones de línea de comandos

  • --transport=stdio|websocket : especifica el protocolo de transporte (predeterminado: stdio)
  • --port=<number> : especifica el puerto para el transporte de WebSocket (predeterminado: 3000)
  • --verbose : Habilitar el registro detallado

Herramientas

El servidor proporciona herramientas para:

  • Operaciones del mouse : mover, hacer clic, arrastrar, etc.
  • Operaciones del teclado : enviar pulsaciones de teclas, operaciones del portapapeles, etc.
  • Gestión de ventanas : buscar, activar, cerrar, redimensionar ventanas, etc.
  • Manipulación de controles : interactúe con controles de UI, botones, campos de texto, etc.
  • Gestión de procesos : iniciar, detener y supervisar procesos
  • Operaciones del sistema : Apagado, suspensión, etc.

Recursos

El servidor proporciona recursos para:

  • Acceso a archivos : leer archivos y listar directorios
  • Capturas de pantalla : captura la pantalla o ventanas específicas

Indicaciones

El servidor proporciona plantillas de indicaciones para:

  • Interacción con ventanas : Busque e interactúe con ventanas
  • Relleno de formularios : automatiza las tareas de llenado de formularios
  • Tareas de automatización : crear scripts para tareas repetitivas
  • Monitoreo : Esperar condiciones específicas

Desarrollo

# Run in development mode npm run dev # Lint the code npm run lint # Run tests npm run test

Licencia

Instituto Tecnológico de Massachusetts (MIT)

-
security - not tested
A
license - permissive license
-
quality - not tested

Un servidor de protocolo de contexto de modelo que envuelve la funcionalidad de AutoIt, permitiendo a los LLM automatizar las tareas del escritorio de Windows, incluidas las operaciones del mouse y el teclado, la administración de ventanas y las interacciones de control de la interfaz de usuario.

  1. Overview
    1. Features
      1. Installation
        1. Usage
          1. Starting the Server
          2. Command Line Options
        2. Tools
          1. Resources
            1. Prompts
              1. Development
                1. License

                  Related MCP Servers

                  • -
                    security
                    F
                    license
                    -
                    quality
                    A Model Context Protocol server that allows LLMs to execute shell commands and receive their output in a controlled manner.
                    Last updated -
                    Python
                  • A
                    security
                    A
                    license
                    A
                    quality
                    A Model Context Protocol server that gives LLMs the ability to interact with Ethereum networks, manage wallets, query blockchain data, and execute smart contract operations through a standardized interface.
                    Last updated -
                    31
                    323
                    2
                    TypeScript
                    MIT License
                  • -
                    security
                    F
                    license
                    -
                    quality
                    A Model Context Protocol server that enables Claude and other LLMs to interact with Notion workspaces, providing capabilities like searching, retrieving, creating and updating pages, as well as managing databases.
                    Last updated -
                    275
                    2
                    TypeScript
                  • -
                    security
                    A
                    license
                    -
                    quality
                    A Model Context Protocol server that provides desktop automation capabilities using RobotJS and screenshot capabilities, enabling LLMs to control mouse movements, keyboard inputs, and capture screenshots of the desktop environment.
                    Last updated -
                    42
                    2
                    JavaScript
                    MIT License

                  View all related MCP servers

                  ID: 5a8vj5indr