MCPControl
Windows-Steuerungsserver für das Model Context Protocol , der programmgesteuerte Kontrolle über Systemvorgänge einschließlich Maus, Tastatur, Fensterverwaltung und Bildschirmaufnahmefunktion bietet.
Hinweis : Dieses Projekt unterstützt derzeit nur Windows.
🔥 Warum MCPControl?
MCPControl schließt die Lücke zwischen KI-Modellen und Ihrem Desktop und ermöglicht eine sichere, programmgesteuerte Steuerung von:
- 🖱️ Mausbewegungen und Klicks
- ⌨️ Tastatureingaben und Tastenkombinationen
- 🪟 Fensterverwaltung
- 📸 Bildschirmaufnahme und -analyse
- 📋 Zwischenablagevorgänge
🔌 Schnellstart
Voraussetzungen
- Build-Tools installieren (einschließlich VC++-Workload)
- Installieren Sie Python (falls noch nicht installiert)
- Installieren Sie Node.js
Installation
- Installieren Sie das MCPControl-Paket
Konfiguration
MCPControl funktioniert am besten in einer virtuellen Maschine mit einer Auflösung von 1280 x 720 für optimale Klickgenauigkeit.
Konfigurieren Sie Ihren Claude-Client für die Verbindung mit MCPControl über SSE-Transport:
Option 1: Direkte SSE-Verbindung
So stellen Sie eine Verbindung zu einem MCPControl-Server her, der auf einer VM oder einem Remotecomputer ausgeführt wird:
Ersetzen Sie 192.168.1.100:3232
durch die IP-Adresse und den Port Ihres Servers.
Option 2: Lokaler Start mit SSE
So starten Sie MCPControl lokal mit SSE-Transport:
Starten des Servers
Starten Sie zunächst den MCPControl-Server auf Ihrer VM oder Ihrem lokalen Computer:
Der Server zeigt Folgendes an:
- Verfügbare Netzwerkschnittstellen und ihre IP-Adressen
- Die Portnummer (Standard: 3232)
- Verbindungsstatusmeldungen
VM-Setup-Beispiel
- Starten Sie Ihre Windows-VM mit einer Auflösung von 1280 x 720
- Installieren Sie MCPControl auf der VM:
- Führen Sie den Server mit SSE-Transport aus:
- Notieren Sie die IP-Adresse der VM (z. B.
192.168.1.100
). - Konfigurieren Sie Claude mit der SSE-URL:
- Starten Sie Claude neu und MCPControl wird in Ihrem MCP-Menü angezeigt!
🔧 CLI-Optionen
MCPControl unterstützt mehrere Befehlszeilenflags für erweiterte Konfigurationen:
Befehlszeilenargumente
--sse
- SSE-Transport (Server-Sent Events) für den Netzwerkzugriff aktivieren--port [number]
– Benutzerdefinierten Port angeben (Standard: 3232)--https
– HTTPS/TLS aktivieren (erforderlich für Remote-Bereitstellungen gemäß MCP-Spezifikation)--cert [path]
– Pfad zur TLS-Zertifikatsdatei (erforderlich mit --https)--key [path]
– Pfad zur privaten TLS-Schlüsseldatei (erforderlich mit --https)
Sicherheitshinweis
Gemäß der MCP-Spezifikation ist HTTPS für alle HTTP-basierten Transporte in Produktionsumgebungen obligatorisch . Verwenden Sie beim Einsatz von MCPControl für den Remotezugriff immer das Flag --https
mit gültigen TLS-Zertifikaten.
🚀 Beliebte Anwendungsfälle
Assistierte Automatisierung
- Anwendungstests : Delegieren Sie wiederholte UI-Tests an Claude, sodass die KI durch die Anwendungen navigieren und Probleme melden kann.
- Workflow-Automatisierung : Lassen Sie Claude Anwendungen in Ihrem Namen bedienen und sich wiederholende Aufgaben erledigen, während Sie sich auf die kreative Arbeit konzentrieren
- Formularausfüllen : Überlassen Sie Claude die Dateneingabe unter Ihrer Aufsicht
KI-Experimente
- KI-Gaming : Sehen Sie, wie Claude durch visuelles Feedback lernt, einfache Spiele zu spielen
- Visuelles Denken : Testen Sie Claudes Fähigkeit, visuelle Schnittstellen zu navigieren und visuelle Rätsel zu lösen
- Mensch-KI-Zusammenarbeit : Entdecken Sie neue Interaktionsparadigmen, bei denen Claude Ihren Bildschirm sehen und bei komplexen Aufgaben helfen kann
Entwicklung und Tests
- Anwendungsübergreifende Integration : Überbrücken Sie Anwendungen, die normalerweise nicht kommunizieren
- UI-Test-Framework : Erstellen Sie robuste Testszenarien mit visueller Validierung
- Demo-Erstellung : Automatisieren Sie die Erstellung von Produktdemonstrationen
⚠️ WICHTIGER HAFTUNGSAUSSCHLUSS
DIESE SOFTWARE IST EXPERIMENTELL UND POTENZIELL GEFÄHRLICH
Durch die Verwendung dieser Software erkennen Sie Folgendes an und akzeptieren Folgendes:
- Es ist von Natur aus riskant, KI-Modellen über dieses Tool die direkte Kontrolle über Ihren Computer zu geben
- Diese Software kann Ihre Maus, Tastatur und andere Systemfunktionen steuern, was möglicherweise unbeabsichtigte Folgen haben könnte
- Sie verwenden diese Software ausschließlich auf Ihr eigenes Risiko
- Die Entwickler und Mitwirkenden dieses Projekts übernehmen KEINE Verantwortung für Schäden, Datenverluste oder andere Folgen, die durch die Verwendung dieser Software entstehen können
- Dieses Werkzeug sollte nur in kontrollierten Umgebungen mit entsprechenden Sicherheitsmaßnahmen verwendet werden
VERWENDUNG AUF EIGENES RISIKO
🌟 Funktionen
🔧 Automatisierungsanbieter
MCPControl unterstützt mehrere Automatisierungsanbieter für unterschiedliche Anwendungsfälle:
- Keysender (Standard) – Native Windows-Automatisierung mit hoher Zuverlässigkeit
- powershell - Windows PowerShell-basierte Automatisierung für einfachere Vorgänge
- autohotkey - AutoHotkey v2-Skripting für erweiterte Automatisierungsanforderungen
Anbieterkonfiguration
Sie können den Automatisierungsanbieter mithilfe von Umgebungsvariablen konfigurieren:
Oder verwenden Sie die modulare Konfiguration für bestimmte Vorgänge:
Siehe anbieterspezifische Dokumentation:
🛠️ Entwicklungs-Setup
Wenn Sie daran interessiert sind, Beiträge zu leisten oder aus der Quelle zu erstellen, finden Sie ausführliche Anweisungen in CONTRIBUTING.md .
Entwicklungsanforderungen
Um dieses Projekt für die Entwicklung zu erstellen, benötigen Sie:
- Windows-Betriebssystem (erforderlich für die Keysender-Abhängigkeit)
- Node.js 18 oder höher (Installation mit dem offiziellen Windows-Installationsprogramm, das Build-Tools enthält)
- npm-Paketmanager
- Native Build-Tools:
- node-gyp:
npm install -g node-gyp
- cmake-js:
npm install -g cmake-js
- node-gyp:
Die Keysender-Abhängigkeit basiert auf Windows-spezifischen nativen Modulen, die diese Build-Tools erfordern.
📋 Projektstruktur
/src
/handlers
- Anforderungshandler und Toolverwaltung/tools
– Implementierungen der Kernfunktionen/types
– TypeScript-Typdefinitionenindex.ts
– Haupteinstiegspunkt der Anwendung
🔖 Repository-Zweige
main
- Hauptentwicklungszweig mit den neuesten Funktionen und Änderungenrelease
– Stabiler Release-Zweig, der das neueste stabile Tag widerspiegelt (derzeit v0.2.0)
Versionsinstallation
Sie können bestimmte Versionen von MCPControl mit npm installieren:
📚 Abhängigkeiten
- @modelcontextprotocol/sdk – MCP SDK für die Protokollimplementierung
- keysender – Nur für Windows verfügbare UI-Automatisierungsbibliothek
- clipboardy - Handhabung der Zwischenablage
- sharp - Bildverarbeitung
- uuid - UUID-Generierung
🚧 Bekannte Einschränkungen
- Fensterminimierungs-/Wiederherstellungsvorgänge werden derzeit nicht unterstützt
- Je nach Konfiguration funktionieren mehrere Bildschirmfunktionen möglicherweise nicht wie erwartet.
- Das Dienstprogramm get_screenshot funktioniert nicht mit der VS Code-Erweiterung Cline. Siehe GitHub-Problem Nr. 1865.
- Für einige Vorgänge sind möglicherweise je nach Zielanwendung erhöhte Berechtigungen erforderlich.
- Es wird nur Windows unterstützt
- MCPControl funktioniert am besten bei einer Auflösung von 1280 x 720 Pixeln auf einem einzelnen Bildschirm. Die Klickgenauigkeit ist für diese Auflösung optimiert. Wir arbeiten an einem Fehler im Offset-/Skalierungsproblem und suchen Tester oder Unterstützung bei der Erstellung von Testtools.
👥 Beitragen
Siehe CONTRIBUTING.md
⚖️ Lizenz
Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der Datei LICENSE.
📖 Referenzen
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Windows-Steuerungsserver für das Model Context Protocol, der programmgesteuerte Kontrolle über Systemvorgänge einschließlich Maus, Tastatur, Fensterverwaltung und Bildschirmaufnahmefunktion bietet.
Related MCP Servers
- AsecurityAlicenseAqualityA Model Context Protocol server that provides programmatic access to the Windows terminal, enabling AI models to interact with the Windows command line through standardized tools for writing commands, reading output, and sending control signals.Last updated -3JavaScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that provides secure command-line access to Windows systems, allowing MCP clients like Claude Desktop to safely execute commands in PowerShell, CMD, and Git Bash shells with configurable security controls.Last updated -9470210JavaScriptMIT License
- -securityAlicense-qualityA Model Context Protocol server that wraps AutoIt functionality, enabling LLMs to automate Windows desktop tasks including mouse/keyboard operations, window management, and UI control interactions.Last updated -TypeScriptMIT License
- AsecurityAlicenseAqualityA secure Model Context Protocol server that allows AI models to safely interact with Windows command-line functionality, enabling controlled execution of system commands, project creation, and system information retrieval.Last updated -83TypeScriptMIT License