Integrations
Serves as the runtime environment for the MCP server, with Node.js version 14.x or higher required for operation.
Automatización de escritorio MCP
Un servidor de Protocolo de Contexto de Modelo que proporciona funciones de automatización de escritorio mediante RobotJS y captura de pantalla. Este servidor permite a los LLM controlar los movimientos del ratón, las entradas del teclado y capturar capturas de pantalla del entorno de escritorio.
Configuración para utilizar Desktop Automation Server
A continuación se explica cómo configurar Claude Desktop para utilizar el servidor MCP Desktop Automation:
NPX
Permisos
Este servidor requiere permisos a nivel de sistema para:
- Captura capturas de pantalla de tu pantalla
- Controlar el movimiento y los clics del ratón
- Simular la entrada del teclado
Cuando ejecute por primera vez Claude Desktop con este servidor, es posible que deba otorgar estos permisos en la configuración de seguridad de su sistema operativo.
Limitaciones
Si bien este servidor funciona con varios clientes MCP, se ha probado principalmente con Claude Desktop.
Importante : La implementación actual tiene un límite de tamaño de respuesta de 1 MB. Para las capturas de pantalla, esto significa:
- Las capturas de pantalla de alta resolución pueden exceder este límite y fallar
- Las pruebas han demostrado que la resolución de 800x600 funciona de manera confiable.
- Considere reducir la resolución de la pantalla o capturar áreas específicas de la pantalla si encuentra problemas
Requisitos
- Node.js (>=14.x)
Componentes
Herramientas
- obtener_tamaño_de_pantalla
- Obtiene las dimensiones de la pantalla.
- No se requieren parámetros de entrada
- captura de pantalla
- Captura el contenido de la pantalla actual
- No se requieren parámetros de entrada
- pulsación del teclado
- Presiona una tecla del teclado o una combinación de teclas
- Entradas:
key
(cadena, obligatoria): tecla a presionar (por ejemplo, 'enter', 'a', 'control')modifiers
(matriz de cadenas, opcional): Teclas modificadoras que se mantienen pulsadas al presionar la tecla. Valores posibles: "Control", "Mayús", "Alt", "Comando".
- tipo de teclado
- Escribe texto en la posición actual del cursor
- Entrada:
text
(cadena, obligatorio): Texto a escribir
- clic del ratón
- Realiza un clic del ratón
- Entradas:
button
(cadena, opcional, predeterminado: "izquierdo"): Botón del ratón para hacer clic. Valores posibles: "izquierdo", "derecho", "medio".double
(booleano, opcional, valor predeterminado: falso): si se debe realizar un doble clic
- movimiento del ratón
- Mueve el ratón a las coordenadas especificadas
- Entradas:
x
(número, obligatorio): coordenada Xy
(número, obligatorio): coordenada Y
Recursos
El servidor proporciona acceso a capturas de pantalla:
- Lista de capturas de pantalla (
screenshot://list
)- Enumera todas las capturas de pantalla disponibles por nombre
- Contenido de captura de pantalla (
screenshot://{id}
)- Imágenes PNG de capturas de pantalla
- Accesible a través del ID de captura de pantalla (nombramiento basado en marca de tiempo)
Características principales
- Control del ratón de escritorio
- Simulación de entrada de teclado
- Detección del tamaño de la pantalla
- Capacidades de captura de pantalla
- Formato de respuesta JSON simple
Licencia
Este servidor MCP cuenta con la licencia MIT. Esto significa que puede usar, modificar y distribuir el software libremente, sujeto a los términos y condiciones de la licencia MIT. Para más detalles, consulte el archivo de LICENCIA en el repositorio del proyecto.
This server cannot be installed
Un servidor de protocolo de contexto de modelo que proporciona capacidades de automatización de escritorio mediante RobotJS y capacidades de captura de pantalla, lo que permite a los LLM controlar los movimientos del mouse, las entradas del teclado y capturar capturas de pantalla del entorno de escritorio.
Appeared in Searches
- Creating a Due Diligence Report for Rizhao Urban Investment Using Audit Reports, Annual Reports, and Rating Reports
- A Windows COM server for automating Windows tasks
- Using Claude Desktop to Create a Document in Pages on Mac
- A server for connecting an agent to operate on an open-world basis for functionality like Siri or Alexa
- Understanding and Using the Browser Console