Windows-MCP

MIT License

Windows MCP ist ein schlankes Open-Source-Projekt, das eine nahtlose Integration zwischen KI-Agenten und dem Windows-Betriebssystem ermöglicht. Als MCP-Server schließt es die Lücke zwischen LLMs und dem Windows-Betriebssystem und ermöglicht Agenten die Durchführung von Aufgaben wie Dateinavigation, Anwendungssteuerung, UI-Interaktion, Qualitätssicherungstests und mehr.

https://github.com/user-attachments/assets/45976f41-7dac-47f3-93a2-2b867feb9433

✨ Hauptmerkmale

  • Nahtlose Windows-Integration
    Interagiert nativ mit Windows-UI-Elementen, öffnet Apps, steuert Fenster, simuliert Benutzereingaben und mehr.
  • Verwenden Sie beliebige LLMs (Vision optional) . Anders als viele Automatisierungstools verlässt sich Windows MCP nicht auf herkömmliche Computer-Vision-Techniken oder bestimmte, fein abgestimmte Modelle. Es funktioniert mit beliebigen LLMs, wodurch die Komplexität und die Einrichtungszeit reduziert werden.
  • Umfangreiches Toolset für die UI-Automatisierung
    Enthält Tools für die grundlegende Tastatur- und Mausbedienung sowie zum Erfassen des Fenster-/UI-Status.
  • Leichtgewichtig und Open Source
    Minimale Abhängigkeiten und einfache Einrichtung mit vollständigem Quellcode, der unter der MIT-Lizenz verfügbar ist.
  • Anpassbar und erweiterbar
    Passen Sie Tools einfach an oder erweitern Sie sie, um sie Ihren individuellen Automatisierungs- oder KI-Integrationsanforderungen anzupassen.
  • Echtzeit-Interaktion
    Die typische Latenz zwischen Aktionen (z. B. von einem Mausklick zum nächsten) beträgt 4 bis 8 Sekunden und kann je nach Anzahl der aktiven Anwendungen und Systemlast leicht variieren.

Unterstützte Betriebssysteme

  • Windows 10
  • Windows 11

Installation

Voraussetzungen

  • Python 3.12+
  • Anthropic Claude Desktop-App oder andere MCP-Clients
  • UV (Python-Paketmanager), Installation mit pip install uv

🏁 Erste Schritte

  1. Klonen Sie das Repository.
git clone https://github.com/Computer-Agent/Windows-MCP.git cd Windows-MCP
  1. Installieren Sie Abhängigkeiten:
uv pip install -r pyproject.toml
  1. Stellen Sie eine Verbindung zum MCP-Server her

Kopieren Sie das folgende JSON mit den entsprechenden {{PATH}}-Werten:

{ "mcpServers": { "windows-mcp": { "command": "{{PATH_TO_UV}}", "args": [ "--directory", "{{PATH_TO_SRC}}/Windows-MCP", "run", "server.py" ] } } }

Für Claude speichern Sie dies als claude_desktop_config.json in Ihrem Claude Desktop-Konfigurationsverzeichnis unter:

%APPDATA%/Claude/claude_desktop_config.json
  1. Starten Sie Claude Desktop neu

Öffnen Sie Claude Desktop. Windows-MCP sollte jetzt als verfügbare Integration angezeigt werden.

Weitere Informationen zur Fehlerbehebung bei der Claude Desktop-Integration finden Sie in der MCP-Dokumentation . Die Dokumentation enthält hilfreiche Tipps zum Überprüfen von Protokollen und zum Beheben häufiger Probleme.


🛠️MCP-Tools

Claude kann auf die folgenden Tools zugreifen, um mit Windows zu interagieren:

  • Click-Tool : Klicken Sie auf die angegebenen Koordinaten auf dem Bildschirm.
  • Type-Tool : Geben Sie Text in ein Element ein (löscht optional vorhandenen Text).
  • Clipboard-Tool : Kopieren oder Einfügen mithilfe der Systemzwischenablage.
  • Scroll-Tool : Nach oben/unten scrollen.
  • Drag-Tool : Von einem Punkt zum anderen ziehen.
  • Move-Tool : Mauszeiger bewegen.
  • Shortcut-Tool : Drücken Sie Tastaturkurzbefehle ( Ctrl+c , Alt+Tab usw.).
  • Key-Tool : Drücken Sie eine einzelne Taste.
  • Wait-Tool : Pause für eine definierte Dauer.
  • State-Tool : Kombinierter Snapshot aktiver Apps und interaktiver UI-Elemente.
  • Screenshot-Tool : Machen Sie einen Screenshot des Desktops.
  • Launch-Tool : Zum Starten einer Anwendung über das Startmenü.
  • Shell-Tool : Zum Ausführen von PowerShell-Befehlen.

⚠️Vorsicht

Dieses MCP interagiert direkt mit Ihrem Windows-Betriebssystem, um Aktionen auszuführen. Verwenden Sie es mit Vorsicht und vermeiden Sie den Einsatz in Umgebungen, in denen solche Risiken nicht toleriert werden können.

🪪Lizenz

Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der Datei LICENSE .

🤝Beitrag

Beiträge sind willkommen! Einrichtungsanweisungen und Entwicklungsrichtlinien finden Sie unter „MITWIRKEN“ .

Mit ❤️ von Jeomon George

-
security - not tested
A
license - permissive license
-
quality - not tested

Ein leichtgewichtiger Server, der KI-Agenten die Interaktion mit dem Windows-Betriebssystem ermöglicht und so Dateinavigation, Anwendungssteuerung, UI-Interaktion und QA-Tests über verschiedene Tools ermöglicht.

  1. Unterstützte Betriebssysteme
    1. Installation
      1. Voraussetzungen
    2. 🏁 Erste Schritte
      1. 🛠️MCP-Tools
        1. ⚠️Vorsicht
          1. 🪪Lizenz
            1. 🤝Beitrag

              Related MCP Servers

              • A
                security
                A
                license
                A
                quality
                A Model Context Protocol server that enables AI clients to interact with virtual Ubuntu desktops, allowing them to browse the web, run code, and control instances through mouse/keyboard actions and bash commands.
                Last updated -
                5
                9
                JavaScript
                MIT License
              • -
                security
                A
                license
                -
                quality
                A Model Context Protocol server that enables AI agents to interact with ClickUp workspaces, allowing task creation, management, and workspace organization through natural language commands.
                Last updated -
                376
                MIT License
              • -
                security
                F
                license
                -
                quality
                A server that enables AI systems to browse, retrieve content from, and interact with web pages through the Model Context Protocol.
                Last updated -
              • -
                security
                F
                license
                -
                quality
                A lightweight server that enables AI assistants like Cursor & Claude to read from and write to Obsidian vaults, allowing actions like creating notes, checking existing content, and managing todos through natural language.
                Last updated -
                192
                8
                TypeScript

              View all related MCP servers

              ID: g8lizqmcdh