Automatización del escritorio de Windows MCP
Un servidor de Protocolo de Contexto de Modelo (MCP) para la automatización del escritorio de Windows mediante AutoIt.
Descripción general
Este proyecto proporciona un servidor MCP de TypeScript que envuelve el paquete node-autoit-koffi , lo que permite que las aplicaciones LLM automaticen las tareas del escritorio de Windows a través del protocolo MCP.
El servidor expone:
Herramientas : Todas las funciones de AutoIt son herramientas MCP
Recursos : Acceso a archivos y capacidades de captura de pantalla
Indicaciones : Plantillas para tareas de automatización comunes
Related MCP server: WinTerm MCP
Características
Envoltura completa de todas las funciones de AutoIt como herramientas MCP
Soporte para transportes stdio y WebSocket
Recursos de acceso a archivos para leer archivos y directorios
Recursos de captura de pantalla para capturar la pantalla o ventanas específicas
Plantillas de indicaciones para tareas de automatización comunes
Tipado estricto de TypeScript en todo momento
Instalación
# Clone the repository
git clone https://github.com/yourusername/mcp-windows-desktop-automation.git
cd mcp-windows-desktop-automation
# Install dependencies
npm install
# Build the project
npm run buildUso
Iniciando el servidor
# Start with stdio transport (default)
npm start
# Start with WebSocket transport
npm start -- --transport=websocket --port=3000
# Enable verbose logging
npm start -- --verboseOpciones de línea de comandos
--transport=stdio|websocket: especifica el protocolo de transporte (predeterminado: stdio)--port=<number>: especifica el puerto para el transporte de WebSocket (predeterminado: 3000)--verbose: Habilitar el registro detallado
Herramientas
El servidor proporciona herramientas para:
Operaciones del mouse : mover, hacer clic, arrastrar, etc.
Operaciones del teclado : enviar pulsaciones de teclas, operaciones del portapapeles, etc.
Gestión de ventanas : buscar, activar, cerrar, redimensionar ventanas, etc.
Manipulación de controles : interactúe con controles de UI, botones, campos de texto, etc.
Gestión de procesos : iniciar, detener y supervisar procesos
Operaciones del sistema : Apagado, suspensión, etc.
Recursos
El servidor proporciona recursos para:
Acceso a archivos : leer archivos y listar directorios
Capturas de pantalla : captura la pantalla o ventanas específicas
Indicaciones
El servidor proporciona plantillas de indicaciones para:
Interacción con ventanas : Busque e interactúe con ventanas
Relleno de formularios : automatiza las tareas de llenado de formularios
Tareas de automatización : crear scripts para tareas repetitivas
Monitoreo : Esperar condiciones específicas
Desarrollo
# Run in development mode
npm run dev
# Lint the code
npm run lint
# Run tests
npm run testLicencia
Instituto Tecnológico de Massachusetts (MIT)