Computer Control MCP

by AB498

Integrations

  • Offers a community support channel through Discord for users to get help with the MCP server.

  • Hosts the project repository on GitHub where users can access code, documentation, and demonstration resources.

  • Uses ONNXRuntime for efficient machine learning model execution to power OCR capabilities in the MCP server.

Computersteuerung MCP

MCP-Server, der Computersteuerungsfunktionen wie Maus, Tastatur, OCR usw. mithilfe von PyAutoGUI, RapidOCR und ONNXRuntime bereitstellt. Ähnlich wie „computer-use“ von Anthropic. Ohne externe Abhängigkeiten.

  • Nur unter Windows getestet. Sollte auch auf anderen Plattformen funktionieren.

Schnelle Verwendung (MCP-Setup mit uvx )

Hinweis: Beim ersten Ausführen uvx computer-control-mcp@latest werden Python-Abhängigkeiten (ca. 70 MB) heruntergeladen, was einige Zeit in Anspruch nehmen kann. Es wird empfohlen, dies in einem Terminal auszuführen, bevor Sie es als MCP verwenden. Nachfolgende Ausführungen erfolgen sofort.

{ "mcpServers": { "computer-control-mcp": { "command": "uvx", "args": ["computer-control-mcp@latest"] } } }

ODER global mit pip installieren:

pip install computer-control-mcp

Führen Sie dann den Server mit folgendem Befehl aus:

computer-control-mcp # instead of uvx computer-control-mcp, so you can use the latest version, also you can `uv cache clean` to clear the cache and `uvx` again to use latest version.

Merkmale

  • Steuern Sie Mausbewegungen und Klicks
  • Geben Sie Text an der aktuellen Cursorposition ein
  • Machen Sie Screenshots des gesamten Bildschirms oder bestimmter Fenster mit optionalem Speichern im Download-Verzeichnis
  • Extrahieren Sie Text aus Screenshots mithilfe von OCR (Optical Character Recognition)
  • Fenster auflisten und aktivieren
  • Drücken Sie die Tastaturtasten
  • Drag-and-Drop-Vorgänge

Verfügbare Tools

Maussteuerung

  • click_screen(x: int, y: int) : Klicken Sie an den angegebenen Bildschirmkoordinaten
  • move_mouse(x: int, y: int) : Bewegen Sie den Mauszeiger zu den angegebenen Koordinaten
  • drag_mouse(from_x: int, from_y: int, to_x: int, to_y: int, duration: float = 0.5) : Maus von einer Position zur anderen ziehen

Tastatursteuerung

  • type_text(text: str) : Geben Sie den angegebenen Text an der aktuellen Cursorposition ein
  • press_key(key: str) : Drücken Sie eine angegebene Taste auf der Tastatur

Bildschirm- und Fensterverwaltung

  • take_screenshot(title_pattern: str = None, use_regex: bool = False, threshold: int = 60, with_ocr_text_and_coords: bool = False, scale_percent_for_ocr: int = 100, save_to_downloads: bool = False) : Bildschirm oder Fenster mit optionaler OCR erfassen
  • get_screen_size() : Aktuelle Bildschirmauflösung abrufen
  • list_windows() : Listet alle geöffneten Fenster auf
  • activate_window(title_pattern: str, use_regex: bool = False, threshold: int = 60) : Bringt das angegebene Fenster in den Vordergrund

Entwicklung

Einrichten der Entwicklungsumgebung

# Clone the repository git clone https://github.com/AB498/computer-control-mcp.git cd computer-control-mcp # Install in development mode pip install -e . # Start server python -m computer_control_mcp.core

Ausführen von Tests

python -m pytest

API-Referenz

Ausführliche Informationen zu den verfügbaren Funktionen und Klassen finden Sie in der API-Referenz .

Lizenz

MIT

Weitere Informationen oder Hilfe

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

MCP-Server, der Computersteuerungsfunktionen einschließlich Mausbewegungen, Tastaturaktionen, Screenshot-Erfassung mit OCR und Fensterverwaltung über eine einheitliche API bereitstellt.

  1. MCP-Server, der Computersteuerungsfunktionen wie Maus, Tastatur, OCR usw. mithilfe von PyAutoGUI, RapidOCR und ONNXRuntime bereitstellt. Ähnlich wie „computer-use“ von Anthropic. Ohne externe Abhängigkeiten.
    1. Schnelle Verwendung (MCP-Setup mit uvx )
      1. Merkmale
        1. Verfügbare Tools
          1. Maussteuerung
          2. Tastatursteuerung
          3. Bildschirm- und Fensterverwaltung
        2. Entwicklung
          1. Einrichten der Entwicklungsumgebung
          2. Ausführen von Tests
        3. API-Referenz
          1. Lizenz
            1. Weitere Informationen oder Hilfe

              Related MCP Servers

              • -
                security
                A
                license
                -
                quality
                A Windows control server built using nut.js and Model Context Protocol (MCP), providing programmatic control over Windows system operations including mouse, keyboard, window management, and screen capture functionality.
                Last updated -
                137
                84
                TypeScript
                MIT License
              • -
                security
                A
                license
                -
                quality
                A MCP server that provides browser automation tools, allowing users to navigate websites, take screenshots, click elements, fill forms, and execute JavaScript through Playwright.
                Last updated -
                Python
                Apache 2.0
                • Apple
              • -
                security
                A
                license
                -
                quality
                An MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.
                Last updated -
                Python
                MIT License
                • Apple
                • Linux
              • -
                security
                A
                license
                -
                quality
                Provides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.
                Last updated -
                6
                Python
                MIT License
                • Apple
                • Linux

              View all related MCP servers

              ID: ntu33pgw1o