Computer Control MCP

by AB498

Integrations

  • Offers a community support channel through Discord for users to get help with the MCP server.

  • Hosts the project repository on GitHub where users can access code, documentation, and demonstration resources.

  • Uses ONNXRuntime for efficient machine learning model execution to power OCR capabilities in the MCP server.

Control por computadora MCP

Servidor MCP que proporciona funciones de control de computadora, como ratón, teclado, OCR, etc., mediante PyAutoGUI, RapidOCR y ONNXRuntime. Similar a "computer-use" de Anthropic. Sin dependencias externas.

  • Probado solo en Windows. Debería funcionar en otras plataformas.

Uso rápido (Configuración de MCP con uvx )

{ "mcpServers": { "computer-control-mcp": { "command": "uvx", "args": ["computer-control-mcp@latest"] } } }

O instalar globalmente con pip :

pip install computer-control-mcp

Luego ejecute el servidor con:

computer-control-mcp # instead of uvx computer-control-mcp, so you can use the latest version, also you can `uv cache clean` to clear the cache and `uvx` again to use latest version.

Características

  • Controlar los movimientos y clics del ratón
  • Escriba texto en la posición actual del cursor
  • Tome capturas de pantalla de toda la pantalla o de ventanas específicas con opción de guardarlas en el directorio de descargas
  • Extraer texto de capturas de pantalla mediante OCR (reconocimiento óptico de caracteres)
  • Listar y activar ventanas
  • Presione las teclas del teclado
  • Operaciones de arrastrar y soltar

Herramientas disponibles

Control del ratón

  • click_screen(x: int, y: int) : Haga clic en las coordenadas de pantalla especificadas
  • move_mouse(x: int, y: int) : Mueve el cursor del mouse a las coordenadas especificadas
  • drag_mouse(from_x: int, from_y: int, to_x: int, to_y: int, duration: float = 0.5) : Arrastre el mouse de una posición a otra

Control del teclado

  • type_text(text: str) : Escribe el texto especificado en la posición actual del cursor
  • press_key(key: str) : Presione una tecla del teclado especificada

Gestión de pantallas y ventanas

  • take_screenshot(title_pattern: str = None, use_regex: bool = False, threshold: int = 60, with_ocr_text_and_coords: bool = False, scale_percent_for_ocr: int = 100, save_to_downloads: bool = False) : Capturar pantalla o ventana con OCR opcional
  • get_screen_size() : Obtener la resolución de pantalla actual
  • list_windows() : enumera todas las ventanas abiertas
  • activate_window(title_pattern: str, use_regex: bool = False, threshold: int = 60) : Trae la ventana especificada al primer plano

Desarrollo

Configuración del entorno de desarrollo

# Clone the repository git clone https://github.com/AB498/computer-control-mcp.git cd computer-control-mcp # Install in development mode pip install -e . # Start server python -m computer_control_mcp.core

Ejecución de pruebas

python -m pytest

Referencia de API

Consulte la Referencia de API para obtener información detallada sobre las funciones y clases disponibles.

Licencia

Instituto Tecnológico de Massachusetts (MIT)

Para obtener más información o ayuda

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Servidor MCP que proporciona capacidades de control de computadora, incluidos movimientos del mouse, acciones del teclado, captura de captura de pantalla con OCR y administración de ventanas a través de una API unificada.

  1. Servidor MCP que proporciona funciones de control de computadora, como ratón, teclado, OCR, etc., mediante PyAutoGUI, RapidOCR y ONNXRuntime. Similar a "computer-use" de Anthropic. Sin dependencias externas.
    1. Uso rápido (Configuración de MCP con uvx )
      1. Características
        1. Herramientas disponibles
          1. Control del ratón
          2. Control del teclado
          3. Gestión de pantallas y ventanas
        2. Desarrollo
          1. Configuración del entorno de desarrollo
          2. Ejecución de pruebas
        3. Referencia de API
          1. Licencia
            1. Para obtener más información o ayuda

              Related MCP Servers

              • -
                security
                A
                license
                -
                quality
                A Windows control server built using nut.js and Model Context Protocol (MCP), providing programmatic control over Windows system operations including mouse, keyboard, window management, and screen capture functionality.
                Last updated -
                137
                84
                TypeScript
                MIT License
              • -
                security
                A
                license
                -
                quality
                A MCP server that provides browser automation tools, allowing users to navigate websites, take screenshots, click elements, fill forms, and execute JavaScript through Playwright.
                Last updated -
                Python
                Apache 2.0
                • Apple
              • -
                security
                A
                license
                -
                quality
                An MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.
                Last updated -
                Python
                MIT License
                • Apple
                • Linux
              • -
                security
                A
                license
                -
                quality
                Provides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.
                Last updated -
                6
                Python
                MIT License
                • Apple
                • Linux

              View all related MCP servers

              ID: ntu33pgw1o