Skip to main content
Glama

MCPControl

Windows-Steuerungsserver für das Model Context Protocol , der programmgesteuerte Kontrolle über Systemvorgänge einschließlich Maus, Tastatur, Fensterverwaltung und Bildschirmaufnahmefunktion bietet.

Hinweis : Dieses Projekt unterstützt derzeit nur Windows.

🔥 Warum MCPControl?

MCPControl schließt die Lücke zwischen KI-Modellen und Ihrem Desktop und ermöglicht eine sichere, programmgesteuerte Steuerung von:

  • 🖱️ Mausbewegungen und Klicks
  • ⌨️ Tastatureingaben und Tastenkombinationen
  • 🪟 Fensterverwaltung
  • 📸 Bildschirmaufnahme und -analyse
  • 📋 Zwischenablagevorgänge

🔌 Schnellstart

Voraussetzungen

  1. Build-Tools installieren (einschließlich VC++-Workload)
    # Run as Administrator - may take a few minutes to complete winget install Microsoft.VisualStudio.2022.BuildTools --override "--wait --passive --add Microsoft.VisualStudio.Workload.VCTools --includeRecommended"
  2. Installieren Sie Python (falls noch nicht installiert)
    # Install Python (required for node-gyp) winget install Python.Python.3.12
  3. Installieren Sie Node.js
    # Install latest LTS version winget install OpenJS.NodeJS

Installation

  1. Installieren Sie das MCPControl-Paket
    npm install -g mcp-control

Konfiguration

MCPControl funktioniert am besten in einer virtuellen Maschine mit einer Auflösung von 1280 x 720 für optimale Klickgenauigkeit.

Konfigurieren Sie Ihren Claude-Client für die Verbindung mit MCPControl über SSE-Transport:

Option 1: Direkte SSE-Verbindung

So stellen Sie eine Verbindung zu einem MCPControl-Server her, der auf einer VM oder einem Remotecomputer ausgeführt wird:

{ "mcpServers": { "MCPControl": { "transport": "sse", "url": "http://192.168.1.100:3232/mcp" } } }

Ersetzen Sie 192.168.1.100:3232 durch die IP-Adresse und den Port Ihres Servers.

Option 2: Lokaler Start mit SSE

So starten Sie MCPControl lokal mit SSE-Transport:

{ "mcpServers": { "MCPControl": { "command": "mcp-control", "args": ["--sse"] } } }

Starten des Servers

Starten Sie zunächst den MCPControl-Server auf Ihrer VM oder Ihrem lokalen Computer:

mcp-control --sse

Der Server zeigt Folgendes an:

  • Verfügbare Netzwerkschnittstellen und ihre IP-Adressen
  • Die Portnummer (Standard: 3232)
  • Verbindungsstatusmeldungen

VM-Setup-Beispiel

  1. Starten Sie Ihre Windows-VM mit einer Auflösung von 1280 x 720
  2. Installieren Sie MCPControl auf der VM:
    npm install -g mcp-control
  3. Führen Sie den Server mit SSE-Transport aus:
    mcp-control --sse
  4. Notieren Sie die IP-Adresse der VM (z. B. 192.168.1.100 ).
  5. Konfigurieren Sie Claude mit der SSE-URL:
    { "mcpServers": { "MCPControl": { "transport": "sse", "url": "http://192.168.1.100:3232/mcp" } } }
  6. Starten Sie Claude neu und MCPControl wird in Ihrem MCP-Menü angezeigt!

🔧 CLI-Optionen

MCPControl unterstützt mehrere Befehlszeilenflags für erweiterte Konfigurationen:

# Run with SSE transport on default port (3232) mcp-control --sse # Run with SSE on custom port mcp-control --sse --port 3000 # Run with HTTPS/TLS (required for production deployments) mcp-control --sse --https --cert /path/to/cert.pem --key /path/to/key.pem # Run with HTTPS on custom port mcp-control --sse --https --port 8443 --cert /path/to/cert.pem --key /path/to/key.pem

Befehlszeilenargumente

  • --sse - SSE-Transport (Server-Sent Events) für den Netzwerkzugriff aktivieren
  • --port [number] – Benutzerdefinierten Port angeben (Standard: 3232)
  • --https – HTTPS/TLS aktivieren (erforderlich für Remote-Bereitstellungen gemäß MCP-Spezifikation)
  • --cert [path] – Pfad zur TLS-Zertifikatsdatei (erforderlich mit --https)
  • --key [path] – Pfad zur privaten TLS-Schlüsseldatei (erforderlich mit --https)

Sicherheitshinweis

Gemäß der MCP-Spezifikation ist HTTPS für alle HTTP-basierten Transporte in Produktionsumgebungen obligatorisch . Verwenden Sie beim Einsatz von MCPControl für den Remotezugriff immer das Flag --https mit gültigen TLS-Zertifikaten.

🚀 Beliebte Anwendungsfälle

Assistierte Automatisierung

  • Anwendungstests : Delegieren Sie wiederholte UI-Tests an Claude, sodass die KI durch die Anwendungen navigieren und Probleme melden kann.
  • Workflow-Automatisierung : Lassen Sie Claude Anwendungen in Ihrem Namen bedienen und sich wiederholende Aufgaben erledigen, während Sie sich auf die kreative Arbeit konzentrieren
  • Formularausfüllen : Überlassen Sie Claude die Dateneingabe unter Ihrer Aufsicht

KI-Experimente

  • KI-Gaming : Sehen Sie, wie Claude durch visuelles Feedback lernt, einfache Spiele zu spielen
  • Visuelles Denken : Testen Sie Claudes Fähigkeit, visuelle Schnittstellen zu navigieren und visuelle Rätsel zu lösen
  • Mensch-KI-Zusammenarbeit : Entdecken Sie neue Interaktionsparadigmen, bei denen Claude Ihren Bildschirm sehen und bei komplexen Aufgaben helfen kann

Entwicklung und Tests

  • Anwendungsübergreifende Integration : Überbrücken Sie Anwendungen, die normalerweise nicht kommunizieren
  • UI-Test-Framework : Erstellen Sie robuste Testszenarien mit visueller Validierung
  • Demo-Erstellung : Automatisieren Sie die Erstellung von Produktdemonstrationen

⚠️ WICHTIGER HAFTUNGSAUSSCHLUSS

DIESE SOFTWARE IST EXPERIMENTELL UND POTENZIELL GEFÄHRLICH

Durch die Verwendung dieser Software erkennen Sie Folgendes an und akzeptieren Folgendes:

  • Es ist von Natur aus riskant, KI-Modellen über dieses Tool die direkte Kontrolle über Ihren Computer zu geben
  • Diese Software kann Ihre Maus, Tastatur und andere Systemfunktionen steuern, was möglicherweise unbeabsichtigte Folgen haben könnte
  • Sie verwenden diese Software ausschließlich auf Ihr eigenes Risiko
  • Die Entwickler und Mitwirkenden dieses Projekts übernehmen KEINE Verantwortung für Schäden, Datenverluste oder andere Folgen, die durch die Verwendung dieser Software entstehen können
  • Dieses Werkzeug sollte nur in kontrollierten Umgebungen mit entsprechenden Sicherheitsmaßnahmen verwendet werden

VERWENDUNG AUF EIGENES RISIKO

🌟 Funktionen

🔧 Automatisierungsanbieter

MCPControl unterstützt mehrere Automatisierungsanbieter für unterschiedliche Anwendungsfälle:

  • Keysender (Standard) – Native Windows-Automatisierung mit hoher Zuverlässigkeit
  • powershell - Windows PowerShell-basierte Automatisierung für einfachere Vorgänge
  • autohotkey - AutoHotkey v2-Skripting für erweiterte Automatisierungsanforderungen

Anbieterkonfiguration

Sie können den Automatisierungsanbieter mithilfe von Umgebungsvariablen konfigurieren:

# Use a specific provider for all operations export AUTOMATION_PROVIDER=autohotkey # Configure AutoHotkey executable path (if not in PATH) export AUTOHOTKEY_PATH="C:\Program Files\AutoHotkey\v2\AutoHotkey.exe"

Oder verwenden Sie die modulare Konfiguration für bestimmte Vorgänge:

# Mix and match providers for different operations export AUTOMATION_KEYBOARD_PROVIDER=autohotkey export AUTOMATION_MOUSE_PROVIDER=keysender export AUTOMATION_SCREEN_PROVIDER=keysender export AUTOMATION_CLIPBOARD_PROVIDER=powershell

Siehe anbieterspezifische Dokumentation:

🛠️ Entwicklungs-Setup

Wenn Sie daran interessiert sind, Beiträge zu leisten oder aus der Quelle zu erstellen, finden Sie ausführliche Anweisungen in CONTRIBUTING.md .

Entwicklungsanforderungen

Um dieses Projekt für die Entwicklung zu erstellen, benötigen Sie:

  1. Windows-Betriebssystem (erforderlich für die Keysender-Abhängigkeit)
  2. Node.js 18 oder höher (Installation mit dem offiziellen Windows-Installationsprogramm, das Build-Tools enthält)
  3. npm-Paketmanager
  4. Native Build-Tools:
    • node-gyp: npm install -g node-gyp
    • cmake-js: npm install -g cmake-js

Die Keysender-Abhängigkeit basiert auf Windows-spezifischen nativen Modulen, die diese Build-Tools erfordern.

📋 Projektstruktur

  • /src
    • /handlers - Anforderungshandler und Toolverwaltung
    • /tools – Implementierungen der Kernfunktionen
    • /types – TypeScript-Typdefinitionen
    • index.ts – Haupteinstiegspunkt der Anwendung

🔖 Repository-Zweige

  • main - Hauptentwicklungszweig mit den neuesten Funktionen und Änderungen
  • release – Stabiler Release-Zweig, der das neueste stabile Tag widerspiegelt (derzeit v0.2.0)

Versionsinstallation

Sie können bestimmte Versionen von MCPControl mit npm installieren:

# Install the latest stable release (from release branch) npm install mcp-control # Install a specific version npm install mcp-control@0.1.22

📚 Abhängigkeiten

🚧 Bekannte Einschränkungen

  • Fensterminimierungs-/Wiederherstellungsvorgänge werden derzeit nicht unterstützt
  • Je nach Konfiguration funktionieren mehrere Bildschirmfunktionen möglicherweise nicht wie erwartet.
  • Das Dienstprogramm get_screenshot funktioniert nicht mit der VS Code-Erweiterung Cline. Siehe GitHub-Problem Nr. 1865.
  • Für einige Vorgänge sind möglicherweise je nach Zielanwendung erhöhte Berechtigungen erforderlich.
  • Es wird nur Windows unterstützt
  • MCPControl funktioniert am besten bei einer Auflösung von 1280 x 720 Pixeln auf einem einzelnen Bildschirm. Die Klickgenauigkeit ist für diese Auflösung optimiert. Wir arbeiten an einem Fehler im Offset-/Skalierungsproblem und suchen Tester oder Unterstützung bei der Erstellung von Testtools.

👥 Beitragen

Siehe CONTRIBUTING.md

⚖️ Lizenz

Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der Datei LICENSE.

📖 Referenzen

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Windows-Steuerungsserver für das Model Context Protocol, der programmgesteuerte Kontrolle über Systemvorgänge einschließlich Maus, Tastatur, Fensterverwaltung und Bildschirmaufnahmefunktion bietet.

  1. 🔥 Warum MCPControl?
    1. 🔌 Schnellstart
      1. Voraussetzungen
      2. Installation
      3. Konfiguration
      4. Starten des Servers
      5. VM-Setup-Beispiel
    2. 🔧 CLI-Optionen
      1. Befehlszeilenargumente
      2. Sicherheitshinweis
    3. 🚀 Beliebte Anwendungsfälle
      1. Assistierte Automatisierung
      2. KI-Experimente
      3. Entwicklung und Tests
    4. ⚠️ WICHTIGER HAFTUNGSAUSSCHLUSS
      1. 🌟 Funktionen
        1. 🔧 Automatisierungsanbieter
          1. Anbieterkonfiguration
        2. 🛠️ Entwicklungs-Setup
          1. Entwicklungsanforderungen
        3. 📋 Projektstruktur
          1. 🔖 Repository-Zweige
            1. Versionsinstallation
          2. 📚 Abhängigkeiten
            1. 🚧 Bekannte Einschränkungen
              1. 👥 Beitragen
                1. ⚖️ Lizenz
                  1. 📖 Referenzen

                    Related MCP Servers

                    • A
                      security
                      A
                      license
                      A
                      quality
                      A beginner-friendly Model Context Protocol (MCP) server that helps users understand MCP concepts, provides interactive examples, and lists available MCP servers. This server is designed to be a helpful companion for developers working with MCP. Also comes with a huge list of servers you can install.
                      Last updated -
                      3
                      9
                      36
                      JavaScript
                      Apache 2.0
                    • A
                      security
                      A
                      license
                      A
                      quality
                      A Model Context Protocol server that provides secure command-line access to Windows systems, allowing MCP clients like Claude Desktop to safely execute commands in PowerShell, CMD, and Git Bash shells with configurable security controls.
                      Last updated -
                      9
                      350
                      105
                      JavaScript
                      MIT License
                    • -
                      security
                      -
                      license
                      -
                      quality
                      A Model Context Protocol (MCP) server that interacts with system APIs, allowing users to check connections, search employees, register breakfast, and update chemical information by shifts.
                      Last updated -
                      2
                    • -
                      security
                      A
                      license
                      -
                      quality
                      Provides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.
                      Last updated -
                      6
                      Python
                      MIT License
                      • Apple
                      • Linux

                    View all related MCP servers

                    MCP directory API

                    We provide all the information about MCP servers via our MCP API.

                    curl -X GET 'https://glama.ai/api/mcp/v1/servers/intelligence-assist/MCPControl'

                    If you have feedback or need assistance with the MCP directory API, please join our Discord server