Skip to main content
Glama

Computer Control MCP

by AB498

Control por computadora MCP

Servidor MCP que proporciona funciones de control de computadora, como ratón, teclado, OCR, etc., mediante PyAutoGUI, RapidOCR y ONNXRuntime. Similar a "computer-use" de Anthropic. Sin dependencias externas.

  • Probado solo en Windows. Debería funcionar en otras plataformas.

Demostración de control por computadora MCP

Uso rápido (Configuración de MCP con uvx )

{ "mcpServers": { "computer-control-mcp": { "command": "uvx", "args": ["computer-control-mcp@latest"] } } }

O instalar globalmente con pip :

pip install computer-control-mcp

Luego ejecute el servidor con:

computer-control-mcp # instead of uvx computer-control-mcp, so you can use the latest version, also you can `uv cache clean` to clear the cache and `uvx` again to use latest version.

Características

  • Controlar los movimientos y clics del ratón
  • Escriba texto en la posición actual del cursor
  • Tome capturas de pantalla de toda la pantalla o de ventanas específicas con opción de guardarlas en el directorio de descargas
  • Extraer texto de capturas de pantalla mediante OCR (reconocimiento óptico de caracteres)
  • Listar y activar ventanas
  • Presione las teclas del teclado
  • Operaciones de arrastrar y soltar

Herramientas disponibles

Control del ratón

  • click_screen(x: int, y: int) : Haga clic en las coordenadas de pantalla especificadas
  • move_mouse(x: int, y: int) : Mueve el cursor del mouse a las coordenadas especificadas
  • drag_mouse(from_x: int, from_y: int, to_x: int, to_y: int, duration: float = 0.5) : Arrastre el mouse de una posición a otra

Control del teclado

  • type_text(text: str) : Escribe el texto especificado en la posición actual del cursor
  • press_key(key: str) : Presione una tecla del teclado especificada

Gestión de pantallas y ventanas

  • take_screenshot(title_pattern: str = None, use_regex: bool = False, threshold: int = 60, with_ocr_text_and_coords: bool = False, scale_percent_for_ocr: int = 100, save_to_downloads: bool = False) : Capturar pantalla o ventana con OCR opcional
  • get_screen_size() : Obtener la resolución de pantalla actual
  • list_windows() : enumera todas las ventanas abiertas
  • activate_window(title_pattern: str, use_regex: bool = False, threshold: int = 60) : Trae la ventana especificada al primer plano

Desarrollo

Configuración del entorno de desarrollo

# Clone the repository git clone https://github.com/AB498/computer-control-mcp.git cd computer-control-mcp # Install in development mode pip install -e . # Start server python -m computer_control_mcp.core

Ejecución de pruebas

python -m pytest

Referencia de API

Consulte la Referencia de API para obtener información detallada sobre las funciones y clases disponibles.

Licencia

Instituto Tecnológico de Massachusetts (MIT)

Para obtener más información o ayuda

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Servidor MCP que proporciona capacidades de control de computadora, incluidos movimientos del mouse, acciones del teclado, captura de captura de pantalla con OCR y administración de ventanas a través de una API unificada.

  1. Servidor MCP que proporciona funciones de control de computadora, como ratón, teclado, OCR, etc., mediante PyAutoGUI, RapidOCR y ONNXRuntime. Similar a "computer-use" de Anthropic. Sin dependencias externas.
    1. Uso rápido (Configuración de MCP con uvx )
      1. Características
        1. Herramientas disponibles
          1. Control del ratón
          2. Control del teclado
          3. Gestión de pantallas y ventanas
        2. Desarrollo
          1. Configuración del entorno de desarrollo
          2. Ejecución de pruebas
        3. Referencia de API
          1. Licencia
            1. Para obtener más información o ayuda

              Related MCP Servers

              • -
                security
                A
                license
                -
                quality
                A Windows control server built using nut.js and Model Context Protocol (MCP), providing programmatic control over Windows system operations including mouse, keyboard, window management, and screen capture functionality.
                Last updated -
                79
                137
                TypeScript
                MIT License
              • -
                security
                A
                license
                -
                quality
                A MCP server that provides browser automation tools, allowing users to navigate websites, take screenshots, click elements, fill forms, and execute JavaScript through Playwright.
                Last updated -
                Python
                Apache 2.0
                • Apple
              • -
                security
                A
                license
                -
                quality
                An MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.
                Last updated -
                Python
                MIT License
                • Apple
                • Linux
              • -
                security
                A
                license
                -
                quality
                Provides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.
                Last updated -
                6
                Python
                MIT License
                • Apple
                • Linux

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/AB498/computer-control-mcp'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server