Skip to main content
Glama

Control MCP

Servidor de control de Windows para el Protocolo de contexto de modelo , que proporciona control programático sobre las operaciones del sistema, incluidas las funciones de mouse, teclado, administración de ventanas y captura de pantalla.

Nota : Este proyecto actualmente sólo es compatible con Windows.

🔥¿Por qué MCPControl?

MCPControl cierra la brecha entre los modelos de IA y su escritorio, lo que permite un control programático seguro de:

  • 🖱️ Movimientos y clics del ratón
  • ⌨️ Entrada de teclado y atajos
  • 🪟 Gestión de ventanas
  • 📸 Captura de pantalla y análisis
  • Operaciones del portapapeles

🔌 Inicio rápido

Prerrequisitos

  1. Instalar herramientas de compilación (incluida la carga de trabajo VC++)
    # Run as Administrator - may take a few minutes to complete winget install Microsoft.VisualStudio.2022.BuildTools --override "--wait --passive --add Microsoft.VisualStudio.Workload.VCTools --includeRecommended"
  2. Instalar Python (si aún no está instalado)
    # Install Python (required for node-gyp) winget install Python.Python.3.12
  3. Instalar Node.js
    # Install latest LTS version winget install OpenJS.NodeJS

Instalación

  1. Instalar el paquete MCPControl
    npm install -g mcp-control

Configuración

MCPControl funciona mejor en una máquina virtual con una resolución de 1280x720 para una precisión de clic óptima.

Configure su cliente Claude para conectarse a MCPControl a través del transporte SSE:

Opción 1: Conexión SSE directa

Para conectarse a un servidor MCPControl que se ejecuta en una máquina virtual o una máquina remota:

{ "mcpServers": { "MCPControl": { "transport": "sse", "url": "http://192.168.1.100:3232/mcp" } } }

Reemplace 192.168.1.100:3232 con la dirección IP y el puerto de su servidor.

Opción 2: Lanzamiento local con SSE

Para iniciar MCPControl localmente con transporte SSE:

{ "mcpServers": { "MCPControl": { "command": "mcp-control", "args": ["--sse"] } } }

Iniciando el servidor

Primero, inicie el servidor MCPControl en su VM o máquina local:

mcp-control --sse

El servidor mostrará:

  • Interfaces de red disponibles y sus direcciones IP
  • El número de puerto (predeterminado: 3232)
  • Mensajes de estado de conexión

Ejemplo de configuración de VM

  1. Inicie su máquina virtual Windows con una resolución de 1280x720
  2. Instalar MCPControl en la máquina virtual:
    npm install -g mcp-control
  3. Ejecute el servidor con transporte SSE:
    mcp-control --sse
  4. Anote la dirección IP de la máquina virtual (por ejemplo, 192.168.1.100 )
  5. Configurar Claude con la URL de SSE:
    { "mcpServers": { "MCPControl": { "transport": "sse", "url": "http://192.168.1.100:3232/mcp" } } }
  6. ¡Reinicie Claude y MCPControl aparecerá en su menú MCP!

🔧 Opciones de CLI

MCPControl admite varios indicadores de línea de comandos para configuraciones avanzadas:

# Run with SSE transport on default port (3232) mcp-control --sse # Run with SSE on custom port mcp-control --sse --port 3000 # Run with HTTPS/TLS (required for production deployments) mcp-control --sse --https --cert /path/to/cert.pem --key /path/to/key.pem # Run with HTTPS on custom port mcp-control --sse --https --port 8443 --cert /path/to/cert.pem --key /path/to/key.pem

Argumentos de la línea de comandos

  • --sse - Habilitar el transporte SSE (eventos enviados por el servidor) para el acceso a la red
  • --port [number] - Especifica un puerto personalizado (predeterminado: 3232)
  • --https - Habilitar HTTPS/TLS (requerido para implementaciones remotas según la especificación de MCP)
  • --cert [path] - Ruta al archivo de certificado TLS (requerido con --https)
  • --key [path] - Ruta al archivo de clave privada TLS (requerido con --https)

Nota de seguridad

Según la especificación MCP, HTTPS es obligatorio para todos los transportes basados en HTTP en entornos de producción. Al implementar MCPControl para acceso remoto, utilice siempre el indicador --https con certificados TLS válidos.

🚀 Casos de uso populares

Automatización asistida

  • Pruebas de aplicaciones : delegue las pruebas de IU repetitivas a Claude, lo que permite que la IA navegue por las aplicaciones e informe los problemas.
  • Automatización del flujo de trabajo : Haga que Claude opere aplicaciones en su nombre, manejando tareas repetitivas mientras usted se concentra en el trabajo creativo.
  • Llenado de formularios : deje que Claude se encargue de las tareas de ingreso de datos bajo su supervisión.

Experimentación con IA

  • Juegos de IA : Mira a Claude aprender a jugar juegos sencillos a través de retroalimentación visual.
  • Razonamiento visual : prueba la capacidad de Claude para navegar por interfaces visuales y resolver acertijos visuales.
  • Colaboración humano-IA : Explore nuevos paradigmas de interacción donde Claude puede ver su pantalla y ayudarlo con tareas complejas.

Desarrollo y pruebas

  • Integración entre aplicaciones : conecte aplicaciones que normalmente no se comunican
  • Marco de pruebas de UI : cree escenarios de prueba robustos con validación visual
  • Creación de demostraciones : automatice la creación de demostraciones de productos

⚠️ DESCARGO DE RESPONSABILIDAD IMPORTANTE

ESTE SOFTWARE ES EXPERIMENTAL Y POTENCIALMENTE PELIGROSO

Al utilizar este software, usted reconoce y acepta que:

  • Dar a los modelos de IA control directo sobre su computadora a través de esta herramienta es inherentemente riesgoso.
  • Este software puede controlar el mouse, el teclado y otras funciones del sistema, lo que podría causar consecuencias no deseadas.
  • Usted utiliza este software bajo su propio riesgo.
  • Los creadores y colaboradores de este proyecto NO aceptan ninguna responsabilidad por daños, pérdida de datos u otras consecuencias que puedan surgir del uso de este software.
  • Esta herramienta solo debe utilizarse en entornos controlados con medidas de seguridad adecuadas implementadas.

ÚSELO BAJO SU PROPIA RESPONSABILIDAD

🌟 Características

🔧 Proveedores de automatización

MCPControl admite múltiples proveedores de automatización para diferentes casos de uso:

  • keysender (predeterminado): automatización nativa de Windows con alta confiabilidad
  • powershell - Automatización basada en Windows PowerShell para operaciones más sencillas
  • autohotkey - Scripting de AutoHotkey v2 para necesidades de automatización avanzada

Configuración del proveedor

Puede configurar el proveedor de automatización mediante variables de entorno:

# Use a specific provider for all operations export AUTOMATION_PROVIDER=autohotkey # Configure AutoHotkey executable path (if not in PATH) export AUTOHOTKEY_PATH="C:\Program Files\AutoHotkey\v2\AutoHotkey.exe"

O utilice la configuración modular para operaciones específicas:

# Mix and match providers for different operations export AUTOMATION_KEYBOARD_PROVIDER=autohotkey export AUTOMATION_MOUSE_PROVIDER=keysender export AUTOMATION_SCREEN_PROVIDER=keysender export AUTOMATION_CLIPBOARD_PROVIDER=powershell

Consulte la documentación específica del proveedor:

🛠️ Configuración de desarrollo

Si está interesado en contribuir o desarrollar desde la fuente, consulte CONTRIBUTING.md para obtener instrucciones detalladas.

Requisitos de desarrollo

Para desarrollar este proyecto, necesitarás:

  1. Sistema operativo Windows (necesario para la dependencia de keysender)
  2. Node.js 18 o posterior (instale utilizando el instalador oficial de Windows que incluye herramientas de compilación)
  3. gestor de paquetes npm
  4. Herramientas de compilación nativas:
    • node-gyp: npm install -g node-gyp
    • cmake-js: npm install -g cmake-js

La dependencia de keysender depende de módulos nativos específicos de Windows que requieren estas herramientas de compilación.

📋 Estructura del proyecto

  • /src
    • /handlers - Controladores de solicitudes y gestión de herramientas
    • /tools - Implementaciones de funcionalidades principales
    • /types - Definiciones de tipos de TypeScript
    • index.ts - Punto de entrada principal de la aplicación

🔖 Ramas del repositorio

  • main - Rama de desarrollo principal con las últimas características y cambios
  • release - Rama de lanzamiento estable que refleja la última etiqueta estable (actualmente v0.2.0)

Instalación de la versión

Puede instalar versiones específicas de MCPControl usando npm:

# Install the latest stable release (from release branch) npm install mcp-control # Install a specific version npm install mcp-control@0.1.22

📚 Dependencias

🚧 Limitaciones conocidas

  • Las operaciones de minimizar/restaurar ventanas no son compatibles actualmente
  • Es posible que las funciones de varias pantallas no funcionen como se espera, según la configuración
  • La utilidad get_screenshot no funciona con la extensión Cline de VS Code. Consulte el problema n.° 1865 de GitHub.
  • Algunas operaciones pueden requerir permisos elevados según la aplicación de destino
  • Sólo se admite Windows
  • MCPControl funciona mejor con una resolución de 1280x720 en una sola pantalla. La precisión del clic está optimizada para esta resolución. Estamos solucionando un error de desplazamiento/escalado y buscamos probadores o ayuda para crear herramientas de prueba.

👥 Contribuyendo

Ver CONTRIBUTING.md

⚖️ Licencia

Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.

📖 Referencias

Related MCP Servers

  • A
    security
    A
    license
    A
    quality
    A beginner-friendly Model Context Protocol (MCP) server that helps users understand MCP concepts, provides interactive examples, and lists available MCP servers. This server is designed to be a helpful companion for developers working with MCP. Also comes with a huge list of servers you can install.
    Last updated -
    3
    9
    36
    JavaScript
    Apache 2.0
  • A
    security
    A
    license
    A
    quality
    A Model Context Protocol server that provides secure command-line access to Windows systems, allowing MCP clients like Claude Desktop to safely execute commands in PowerShell, CMD, and Git Bash shells with configurable security controls.
    Last updated -
    9
    350
    105
    JavaScript
    MIT License
  • -
    security
    -
    license
    -
    quality
    A Model Context Protocol (MCP) server that interacts with system APIs, allowing users to check connections, search employees, register breakfast, and update chemical information by shifts.
    Last updated -
    2
  • -
    security
    A
    license
    -
    quality
    Provides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.
    Last updated -
    6
    Python
    MIT License
    • Apple
    • Linux

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/intelligence-assist/MCPControl'

If you have feedback or need assistance with the MCP directory API, please join our Discord server