MCPControl
Projektstatus : Depriorisiert. Dieses Projekt wurde als Experiment gestartet, aber die Windows-Automatisierung ist nicht mein Ding. Ich werde die PRs überprüfen und zusammenführen, aber in Kürze keine neuen Funktionen hinzufügen. Ich werde es möglicherweise später noch einmal besuchen. Suche einen Betreuer.
Windows-Steuerungsserver für das Model Context Protocol , der programmgesteuerte Kontrolle über Systemvorgänge einschließlich Maus, Tastatur, Fensterverwaltung und Bildschirmaufnahmefunktion bietet.
Hinweis : Dieses Projekt unterstützt derzeit nur Windows.
🔥 Warum MCPControl?
MCPControl schließt die Lücke zwischen KI-Modellen und Ihrem Desktop und ermöglicht eine sichere, programmgesteuerte Steuerung von:
- 🖱️ Mausbewegungen und Klicks
- ⌨️ Tastatureingaben und Tastenkombinationen
- 🪟 Fensterverwaltung
- 📸 Bildschirmaufnahme und -analyse
- 📋 Zwischenablagevorgänge
🔌 Schnellstart
- Installieren Sie Node.js (falls noch nicht installiert)Copy
- Konfigurieren Sie die MCP-Einstellungen in Ihrem Claude-Client:Copy
- Starten Sie Ihren Client neu und MCPControl wird in Ihrem MCP-Menü angezeigt!
🚀 Beliebte Anwendungsfälle
Assistierte Automatisierung
- Anwendungstests : Delegieren Sie wiederholte UI-Tests an Claude, sodass die KI durch die Anwendungen navigieren und Probleme melden kann.
- Workflow-Automatisierung : Lassen Sie Claude Anwendungen in Ihrem Namen bedienen und sich wiederholende Aufgaben erledigen, während Sie sich auf die kreative Arbeit konzentrieren
- Formularausfüllen : Überlassen Sie Claude die Dateneingabe unter Ihrer Aufsicht
KI-Experimente
- KI-Gaming : Sehen Sie, wie Claude durch visuelles Feedback lernt, einfache Spiele zu spielen
- Visuelles Denken : Testen Sie Claudes Fähigkeit, visuelle Schnittstellen zu navigieren und visuelle Rätsel zu lösen
- Mensch-KI-Zusammenarbeit : Entdecken Sie neue Interaktionsparadigmen, bei denen Claude Ihren Bildschirm sehen und bei komplexen Aufgaben helfen kann
Entwicklung und Tests
- Anwendungsübergreifende Integration : Überbrücken Sie Anwendungen, die normalerweise nicht kommunizieren
- UI-Test-Framework : Erstellen Sie robuste Testszenarien mit visueller Validierung
- Demo-Erstellung : Automatisieren Sie die Erstellung von Produktdemonstrationen
⚠️ WICHTIGER HAFTUNGSAUSSCHLUSS
DIESE SOFTWARE IST EXPERIMENTELL UND POTENZIELL GEFÄHRLICH
Durch die Verwendung dieser Software erkennen Sie Folgendes an und akzeptieren Folgendes:
- Es ist von Natur aus riskant, KI-Modellen über dieses Tool die direkte Kontrolle über Ihren Computer zu geben
- Diese Software kann Ihre Maus, Tastatur und andere Systemfunktionen steuern, was möglicherweise unbeabsichtigte Folgen haben könnte
- Sie verwenden diese Software ausschließlich auf Ihr eigenes Risiko
- Die Entwickler und Mitwirkenden dieses Projekts übernehmen KEINE Verantwortung für Schäden, Datenverluste oder andere Folgen, die durch die Verwendung dieser Software entstehen können
- Dieses Werkzeug sollte nur in kontrollierten Umgebungen mit entsprechenden Sicherheitsmaßnahmen verwendet werden
VERWENDUNG AUF EIGENES RISIKO
🌟 Funktionen
🛠️ Entwicklungs-Setup
Wenn Sie daran interessiert sind, Beiträge zu leisten oder aus der Quelle zu erstellen, finden Sie ausführliche Anweisungen in CONTRIBUTING.md .
Entwicklungsanforderungen
Um dieses Projekt für die Entwicklung zu erstellen, benötigen Sie:
- Windows-Betriebssystem (erforderlich für die Keysender-Abhängigkeit)
- Node.js 18 oder höher (Installation mit dem offiziellen Windows-Installationsprogramm, das Build-Tools enthält)
- npm-Paketmanager
- Native Build-Tools:
- node-gyp:
npm install -g node-gyp
- cmake-js:
npm install -g cmake-js
- node-gyp:
Die Keysender-Abhängigkeit basiert auf Windows-spezifischen nativen Modulen, die diese Build-Tools erfordern.
📋 Projektstruktur
/src
/handlers
- Anforderungshandler und Toolverwaltung/tools
– Implementierungen der Kernfunktionen/types
– TypeScript-Typdefinitionenindex.ts
– Haupteinstiegspunkt der Anwendung
🔖 Repository-Zweige
main
- Hauptentwicklungszweig mit den neuesten Funktionen und Änderungenrelease
– Stabiler Release-Zweig, der das neueste stabile Tag widerspiegelt (derzeit v0.1.22)
Versionsinstallation
Sie können bestimmte Versionen von MCPControl mit npm installieren:
📚 Abhängigkeiten
- @modelcontextprotocol/sdk – MCP SDK für die Protokollimplementierung
- keysender – Nur für Windows verfügbare UI-Automatisierungsbibliothek
- clipboardy - Handhabung der Zwischenablage
- sharp - Bildverarbeitung
- uuid - UUID-Generierung
🚧 Bekannte Einschränkungen
- Fensterminimierungs-/Wiederherstellungsvorgänge werden derzeit nicht unterstützt
- Je nach Konfiguration funktionieren mehrere Bildschirmfunktionen möglicherweise nicht wie erwartet.
- Das Dienstprogramm get_screenshot funktioniert nicht mit der VS Code-Erweiterung Cline. Siehe GitHub-Problem Nr. 1865.
- Für einige Vorgänge sind möglicherweise je nach Zielanwendung erhöhte Berechtigungen erforderlich.
- Es wird nur Windows unterstützt
- MCPControl funktioniert am besten bei einer Auflösung von 1280 x 720 Pixeln auf einem einzelnen Bildschirm. Die Klickgenauigkeit ist für diese Auflösung optimiert. Wir arbeiten an einem Fehler im Offset-/Skalierungsproblem und suchen Tester oder Unterstützung bei der Erstellung von Testtools.
👥 Beitragen
Siehe CONTRIBUTING.md
Hinweis : Da sich dieses Projekt derzeit im Wartungsmodus befindet, konzentrieren wir uns hauptsächlich auf Fehlerbehebungen. Vollständig implementierte und gut getestete Funktionen werden jedoch für die Integration berücksichtigt. Wir suchen Betreuer, die das Projekt aktiv halten.
⚖️ Lizenz
Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der Datei LICENSE.
📖 Referenzen
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Windows-Steuerungsserver für das Model Context Protocol, der programmgesteuerte Kontrolle über Systemvorgänge einschließlich Maus, Tastatur, Fensterverwaltung und Bildschirmaufnahmefunktion bietet.
Related MCP Servers
- AsecurityAlicenseAqualityA beginner-friendly Model Context Protocol (MCP) server that helps users understand MCP concepts, provides interactive examples, and lists available MCP servers. This server is designed to be a helpful companion for developers working with MCP. Also comes with a huge list of servers you can install.Last updated -3936JavaScriptApache 2.0
- AsecurityAlicenseAqualityA Model Context Protocol server that provides secure command-line access to Windows systems, allowing MCP clients like Claude Desktop to safely execute commands in PowerShell, CMD, and Git Bash shells with configurable security controls.Last updated -9350105JavaScriptMIT License
- -security-license-qualityA Model Context Protocol (MCP) server that interacts with system APIs, allowing users to check connections, search employees, register breakfast, and update chemical information by shifts.Last updated -2
- -securityAlicense-qualityProvides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.Last updated -6PythonMIT License