Integrations
Offers a community support channel through Discord for users to get help with the MCP server.
Hosts the project repository on GitHub where users can access code, documentation, and demonstration resources.
Uses ONNXRuntime for efficient machine learning model execution to power OCR capabilities in the MCP server.
Computersteuerung MCP
MCP-Server, der Computersteuerungsfunktionen wie Maus, Tastatur, OCR usw. mithilfe von PyAutoGUI, RapidOCR und ONNXRuntime bereitstellt. Ähnlich wie „computer-use“ von Anthropic. Ohne externe Abhängigkeiten.
- Nur unter Windows getestet. Sollte auch auf anderen Plattformen funktionieren.
Schnelle Verwendung (MCP-Setup mit uvx
)
Hinweis: Beim ersten Ausführen uvx computer-control-mcp@latest
werden Python-Abhängigkeiten (ca. 70 MB) heruntergeladen, was einige Zeit in Anspruch nehmen kann. Es wird empfohlen, dies in einem Terminal auszuführen, bevor Sie es als MCP verwenden. Nachfolgende Ausführungen erfolgen sofort.
ODER global mit pip
installieren:
Führen Sie dann den Server mit folgendem Befehl aus:
Merkmale
- Steuern Sie Mausbewegungen und Klicks
- Geben Sie Text an der aktuellen Cursorposition ein
- Machen Sie Screenshots des gesamten Bildschirms oder bestimmter Fenster mit optionalem Speichern im Download-Verzeichnis
- Extrahieren Sie Text aus Screenshots mithilfe von OCR (Optical Character Recognition)
- Fenster auflisten und aktivieren
- Drücken Sie die Tastaturtasten
- Drag-and-Drop-Vorgänge
Verfügbare Tools
Maussteuerung
click_screen(x: int, y: int)
: Klicken Sie an den angegebenen Bildschirmkoordinatenmove_mouse(x: int, y: int)
: Bewegen Sie den Mauszeiger zu den angegebenen Koordinatendrag_mouse(from_x: int, from_y: int, to_x: int, to_y: int, duration: float = 0.5)
: Maus von einer Position zur anderen ziehen
Tastatursteuerung
type_text(text: str)
: Geben Sie den angegebenen Text an der aktuellen Cursorposition einpress_key(key: str)
: Drücken Sie eine angegebene Taste auf der Tastatur
Bildschirm- und Fensterverwaltung
take_screenshot(title_pattern: str = None, use_regex: bool = False, threshold: int = 60, with_ocr_text_and_coords: bool = False, scale_percent_for_ocr: int = 100, save_to_downloads: bool = False)
: Bildschirm oder Fenster mit optionaler OCR erfassenget_screen_size()
: Aktuelle Bildschirmauflösung abrufenlist_windows()
: Listet alle geöffneten Fenster aufactivate_window(title_pattern: str, use_regex: bool = False, threshold: int = 60)
: Bringt das angegebene Fenster in den Vordergrund
Entwicklung
Einrichten der Entwicklungsumgebung
Ausführen von Tests
API-Referenz
Ausführliche Informationen zu den verfügbaren Funktionen und Klassen finden Sie in der API-Referenz .
Lizenz
MIT
Weitere Informationen oder Hilfe
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
MCP-Server, der Computersteuerungsfunktionen einschließlich Mausbewegungen, Tastaturaktionen, Screenshot-Erfassung mit OCR und Fensterverwaltung über eine einheitliche API bereitstellt.
- MCP-Server, der Computersteuerungsfunktionen wie Maus, Tastatur, OCR usw. mithilfe von PyAutoGUI, RapidOCR und ONNXRuntime bereitstellt. Ähnlich wie „computer-use“ von Anthropic. Ohne externe Abhängigkeiten.
- Schnelle Verwendung (MCP-Setup mit uvx )
- Merkmale
- Verfügbare Tools
- Entwicklung
- API-Referenz
- Lizenz
- Weitere Informationen oder Hilfe
Related MCP Servers
- -securityAlicense-qualityA Windows control server built using nut.js and Model Context Protocol (MCP), providing programmatic control over Windows system operations including mouse, keyboard, window management, and screen capture functionality.Last updated -13784TypeScriptMIT License
- -securityAlicense-qualityA MCP server that provides browser automation tools, allowing users to navigate websites, take screenshots, click elements, fill forms, and execute JavaScript through Playwright.Last updated -PythonApache 2.0
- -securityAlicense-qualityAn MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.Last updated -PythonMIT License
- -securityAlicense-qualityProvides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.Last updated -6PythonMIT License