MCPControl

Projektstatus : Depriorisiert. Dieses Projekt wurde als Experiment gestartet, aber die Windows-Automatisierung ist nicht mein Ding. Ich werde die PRs überprüfen und zusammenführen, aber in Kürze keine neuen Funktionen hinzufügen. Ich werde es möglicherweise später noch einmal besuchen. Suche einen Betreuer.

Windows-Steuerungsserver für das Model Context Protocol , der programmgesteuerte Kontrolle über Systemvorgänge einschließlich Maus, Tastatur, Fensterverwaltung und Bildschirmaufnahmefunktion bietet.

Hinweis : Dieses Projekt unterstützt derzeit nur Windows.

🔥 Warum MCPControl?

MCPControl schließt die Lücke zwischen KI-Modellen und Ihrem Desktop und ermöglicht eine sichere, programmgesteuerte Steuerung von:

  • 🖱️ Mausbewegungen und Klicks
  • ⌨️ Tastatureingaben und Tastenkombinationen
  • 🪟 Fensterverwaltung
  • 📸 Bildschirmaufnahme und -analyse
  • 📋 Zwischenablagevorgänge

🔌 Schnellstart

  1. Installieren Sie Node.js (falls noch nicht installiert)
    # Visit https://nodejs.org and download the latest LTS version
  2. Konfigurieren Sie die MCP-Einstellungen in Ihrem Claude-Client:
    { "mcpServers": { "MCPControl": { "command": "npx", "args": [ "--no-cache", "-y", "mcp-control" ] } } }
  3. Starten Sie Ihren Client neu und MCPControl wird in Ihrem MCP-Menü angezeigt!

🚀 Beliebte Anwendungsfälle

Assistierte Automatisierung

  • Anwendungstests : Delegieren Sie wiederholte UI-Tests an Claude, sodass die KI durch die Anwendungen navigieren und Probleme melden kann.
  • Workflow-Automatisierung : Lassen Sie Claude Anwendungen in Ihrem Namen bedienen und sich wiederholende Aufgaben erledigen, während Sie sich auf die kreative Arbeit konzentrieren
  • Formularausfüllen : Überlassen Sie Claude die Dateneingabe unter Ihrer Aufsicht

KI-Experimente

  • KI-Gaming : Sehen Sie, wie Claude durch visuelles Feedback lernt, einfache Spiele zu spielen
  • Visuelles Denken : Testen Sie Claudes Fähigkeit, visuelle Schnittstellen zu navigieren und visuelle Rätsel zu lösen
  • Mensch-KI-Zusammenarbeit : Entdecken Sie neue Interaktionsparadigmen, bei denen Claude Ihren Bildschirm sehen und bei komplexen Aufgaben helfen kann

Entwicklung und Tests

  • Anwendungsübergreifende Integration : Überbrücken Sie Anwendungen, die normalerweise nicht kommunizieren
  • UI-Test-Framework : Erstellen Sie robuste Testszenarien mit visueller Validierung
  • Demo-Erstellung : Automatisieren Sie die Erstellung von Produktdemonstrationen

⚠️ WICHTIGER HAFTUNGSAUSSCHLUSS

DIESE SOFTWARE IST EXPERIMENTELL UND POTENZIELL GEFÄHRLICH

Durch die Verwendung dieser Software erkennen Sie Folgendes an und akzeptieren Folgendes:

  • Es ist von Natur aus riskant, KI-Modellen über dieses Tool die direkte Kontrolle über Ihren Computer zu geben
  • Diese Software kann Ihre Maus, Tastatur und andere Systemfunktionen steuern, was möglicherweise unbeabsichtigte Folgen haben könnte
  • Sie verwenden diese Software ausschließlich auf Ihr eigenes Risiko
  • Die Entwickler und Mitwirkenden dieses Projekts übernehmen KEINE Verantwortung für Schäden, Datenverluste oder andere Folgen, die durch die Verwendung dieser Software entstehen können
  • Dieses Werkzeug sollte nur in kontrollierten Umgebungen mit entsprechenden Sicherheitsmaßnahmen verwendet werden

VERWENDUNG AUF EIGENES RISIKO

🌟 Funktionen

🛠️ Entwicklungs-Setup

Wenn Sie daran interessiert sind, Beiträge zu leisten oder aus der Quelle zu erstellen, finden Sie ausführliche Anweisungen in CONTRIBUTING.md .

Entwicklungsanforderungen

Um dieses Projekt für die Entwicklung zu erstellen, benötigen Sie:

  1. Windows-Betriebssystem (erforderlich für die Keysender-Abhängigkeit)
  2. Node.js 18 oder höher (Installation mit dem offiziellen Windows-Installationsprogramm, das Build-Tools enthält)
  3. npm-Paketmanager
  4. Native Build-Tools:
    • node-gyp: npm install -g node-gyp
    • cmake-js: npm install -g cmake-js

Die Keysender-Abhängigkeit basiert auf Windows-spezifischen nativen Modulen, die diese Build-Tools erfordern.

📋 Projektstruktur

  • /src
    • /handlers - Anforderungshandler und Toolverwaltung
    • /tools – Implementierungen der Kernfunktionen
    • /types – TypeScript-Typdefinitionen
    • index.ts – Haupteinstiegspunkt der Anwendung

🔖 Repository-Zweige

  • main - Hauptentwicklungszweig mit den neuesten Funktionen und Änderungen
  • release – Stabiler Release-Zweig, der das neueste stabile Tag widerspiegelt (derzeit v0.1.22)

Versionsinstallation

Sie können bestimmte Versionen von MCPControl mit npm installieren:

# Install the latest stable release (from release branch) npm install mcp-control # Install a specific version npm install mcp-control@0.1.22

📚 Abhängigkeiten

🚧 Bekannte Einschränkungen

  • Fensterminimierungs-/Wiederherstellungsvorgänge werden derzeit nicht unterstützt
  • Je nach Konfiguration funktionieren mehrere Bildschirmfunktionen möglicherweise nicht wie erwartet.
  • Das Dienstprogramm get_screenshot funktioniert nicht mit der VS Code-Erweiterung Cline. Siehe GitHub-Problem Nr. 1865.
  • Für einige Vorgänge sind möglicherweise je nach Zielanwendung erhöhte Berechtigungen erforderlich.
  • Es wird nur Windows unterstützt
  • MCPControl funktioniert am besten bei einer Auflösung von 1280 x 720 Pixeln auf einem einzelnen Bildschirm. Die Klickgenauigkeit ist für diese Auflösung optimiert. Wir arbeiten an einem Fehler im Offset-/Skalierungsproblem und suchen Tester oder Unterstützung bei der Erstellung von Testtools.

👥 Beitragen

Siehe CONTRIBUTING.md

Hinweis : Da sich dieses Projekt derzeit im Wartungsmodus befindet, konzentrieren wir uns hauptsächlich auf Fehlerbehebungen. Vollständig implementierte und gut getestete Funktionen werden jedoch für die Integration berücksichtigt. Wir suchen Betreuer, die das Projekt aktiv halten.

⚖️ Lizenz

Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der Datei LICENSE.

📖 Referenzen

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Windows-Steuerungsserver für das Model Context Protocol, der programmgesteuerte Kontrolle über Systemvorgänge einschließlich Maus, Tastatur, Fensterverwaltung und Bildschirmaufnahmefunktion bietet.

  1. 🔥 Warum MCPControl?
    1. 🔌 Schnellstart
      1. 🚀 Beliebte Anwendungsfälle
        1. Assistierte Automatisierung
        2. KI-Experimente
        3. Entwicklung und Tests
      2. ⚠️ WICHTIGER HAFTUNGSAUSSCHLUSS
        1. 🌟 Funktionen
          1. 🛠️ Entwicklungs-Setup
            1. Entwicklungsanforderungen
          2. 📋 Projektstruktur
            1. 🔖 Repository-Zweige
              1. Versionsinstallation
            2. 📚 Abhängigkeiten
              1. 🚧 Bekannte Einschränkungen
                1. 👥 Beitragen
                  1. ⚖️ Lizenz
                    1. 📖 Referenzen

                      Related MCP Servers

                      • A
                        security
                        A
                        license
                        A
                        quality
                        A beginner-friendly Model Context Protocol (MCP) server that helps users understand MCP concepts, provides interactive examples, and lists available MCP servers. This server is designed to be a helpful companion for developers working with MCP. Also comes with a huge list of servers you can install.
                        Last updated -
                        3
                        9
                        36
                        JavaScript
                        Apache 2.0
                      • A
                        security
                        A
                        license
                        A
                        quality
                        A Model Context Protocol server that provides secure command-line access to Windows systems, allowing MCP clients like Claude Desktop to safely execute commands in PowerShell, CMD, and Git Bash shells with configurable security controls.
                        Last updated -
                        9
                        350
                        105
                        JavaScript
                        MIT License
                      • -
                        security
                        -
                        license
                        -
                        quality
                        A Model Context Protocol (MCP) server that interacts with system APIs, allowing users to check connections, search employees, register breakfast, and update chemical information by shifts.
                        Last updated -
                        2
                      • -
                        security
                        A
                        license
                        -
                        quality
                        Provides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.
                        Last updated -
                        6
                        Python
                        MIT License
                        • Apple
                        • Linux

                      View all related MCP servers

                      ID: r3fdu3l0yz