Skip to main content
Glama

Windows-MCP

by CursorTouch

Windows MCP ist ein schlankes Open-Source-Projekt, das eine nahtlose Integration zwischen KI-Agenten und dem Windows-Betriebssystem ermöglicht. Als MCP-Server schließt es die Lücke zwischen LLMs und dem Windows-Betriebssystem und ermöglicht Agenten die Durchführung von Aufgaben wie Dateinavigation, Anwendungssteuerung, UI-Interaktion, Qualitätssicherungstests und mehr.

https://github.com/user-attachments/assets/d0e7ed1d-6189-4de6-838a-5ef8e1cad54e

✨ Hauptmerkmale

  • Nahtlose Windows-Integration
    Interagiert nativ mit Windows-UI-Elementen, öffnet Apps, steuert Fenster, simuliert Benutzereingaben und mehr.

  • Verwenden Sie beliebige LLMs (Vision optional) . Anders als viele Automatisierungstools verlässt sich Windows MCP nicht auf herkömmliche Computer-Vision-Techniken oder bestimmte, fein abgestimmte Modelle. Es funktioniert mit beliebigen LLMs, wodurch die Komplexität und die Einrichtungszeit reduziert werden.

  • Umfangreiches Toolset für die UI-Automatisierung
    Enthält Tools für die grundlegende Tastatur- und Mausbedienung sowie zum Erfassen des Fenster-/UI-Status.

  • Leichtgewichtig und Open Source
    Minimale Abhängigkeiten und einfache Einrichtung mit vollständigem Quellcode, der unter der MIT-Lizenz verfügbar ist.

  • Anpassbar und erweiterbar
    Passen Sie Tools einfach an oder erweitern Sie sie, um sie Ihren individuellen Automatisierungs- oder KI-Integrationsanforderungen anzupassen.

  • Echtzeit-Interaktion
    Die typische Latenz zwischen Aktionen (z. B. von einem Mausklick zum nächsten) beträgt 4 bis 8 Sekunden und kann je nach Anzahl der aktiven Anwendungen und Systemlast leicht variieren.

Unterstützte Betriebssysteme

  • Windows 10

  • Windows 11

Installation

Voraussetzungen

  • Python 3.12+

  • Anthropic Claude Desktop-App oder andere MCP-Clients

  • UV (Python-Paketmanager), Installation mit pip install uv

🏁 Erste Schritte

  1. Klonen Sie das Repository.

git clone https://github.com/CursorTouch/Windows-MCP.git cd Windows-MCP
  1. Installieren Sie Abhängigkeiten:

uv pip install -r pyproject.toml
  1. Stellen Sie eine Verbindung zum MCP-Server her

Kopieren Sie das folgende JSON mit den entsprechenden {{PATH}}-Werten:

{ "mcpServers": { "windows-mcp": { "command": "{{PATH_TO_UV}}", "args": [ "--directory", "{{PATH_TO_SRC}}/Windows-MCP", "run", "server.py" ] } } }

Für Claude speichern Sie dies als claude_desktop_config.json in Ihrem Claude Desktop-Konfigurationsverzeichnis unter:

%APPDATA%/Claude/claude_desktop_config.json
  1. Starten Sie Claude Desktop neu

Öffnen Sie Claude Desktop. Windows-MCP sollte jetzt als verfügbare Integration angezeigt werden.

Weitere Informationen zur Fehlerbehebung bei der Claude Desktop-Integration finden Sie in der MCP-Dokumentation . Die Dokumentation enthält hilfreiche Tipps zum Überprüfen von Protokollen und zum Beheben häufiger Probleme.


🛠️MCP-Tools

Claude kann auf die folgenden Tools zugreifen, um mit Windows zu interagieren:

  • Click-Tool : Klicken Sie auf die angegebenen Koordinaten auf dem Bildschirm.

  • Type-Tool : Geben Sie Text in ein Element ein (löscht optional vorhandenen Text).

  • Clipboard-Tool : Kopieren oder Einfügen mithilfe der Systemzwischenablage.

  • Scroll-Tool : Nach oben/unten scrollen.

  • Drag-Tool : Von einem Punkt zum anderen ziehen.

  • Move-Tool : Mauszeiger bewegen.

  • Shortcut-Tool : Drücken Sie Tastaturkurzbefehle ( Ctrl+c , Alt+Tab usw.).

  • Key-Tool : Drücken Sie eine einzelne Taste.

  • Wait-Tool : Pause für eine definierte Dauer.

  • State-Tool : Kombinierter Snapshot aktiver Apps und interaktiver UI-Elemente.

  • Screenshot-Tool : Machen Sie einen Screenshot des Desktops.

  • Launch-Tool : Zum Starten einer Anwendung über das Startmenü.

  • Shell-Tool : Zum Ausführen von PowerShell-Befehlen.

⚠️Vorsicht

Dieses MCP interagiert direkt mit Ihrem Windows-Betriebssystem, um Aktionen auszuführen. Verwenden Sie es mit Vorsicht und vermeiden Sie den Einsatz in Umgebungen, in denen solche Risiken nicht toleriert werden können.

🪪Lizenz

Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der Datei LICENSE .

🤝Beitrag

Beiträge sind willkommen! Einrichtungsanweisungen und Entwicklungsrichtlinien finden Sie unter „MITWIRKEN“ .

Mit ❤️ von Jeomon George gemacht

Zitat

@misc{ author = {George, Jeomon}, title = {Windows-MCP}, year = {2024}, publisher = {GitHub}, howpublished = {\url{https://github.com/Jeomon/Windows-MCP}}, note = {Lightweight open-source project for integrating LLM agents with Windows} }
-
security - not tested
-
license - not tested
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Ein leichtgewichtiger Server, der KI-Agenten die Interaktion mit dem Windows-Betriebssystem ermöglicht und so Dateinavigation, Anwendungssteuerung, UI-Interaktion und QA-Tests über verschiedene Tools ermöglicht.

  1. Unterstützte Betriebssysteme
    1. Installation
      1. Voraussetzungen
    2. 🏁 Erste Schritte
      1. 🛠️MCP-Tools
        1. ⚠️Vorsicht
          1. 🪪Lizenz
            1. 🤝Beitrag
              1. Zitat

                Related MCP Servers

                • -
                  security
                  -
                  license
                  -
                  quality
                  A server that allows AI models to automate Microsoft Office applications (Word, Excel, PowerPoint, etc.) through COM interface on Windows, enabling natural language control of Office functions.
                  Last updated -
                  26
                • -
                  security
                  -
                  license
                  -
                  quality
                  A lightweight open-source server that enables AI agents to interact with the Windows operating system, allowing for file navigation, application control, UI interaction, and QA testing without requiring computer vision.
                  Last updated -
                  3,328
                  MIT License
                • -
                  security
                  -
                  license
                  -
                  quality
                  A server that enables AI assistants to control a browser through tools, allowing them to perform web automation tasks like navigation, typing, clicking, and taking screenshots.
                  Last updated -
                • A
                  security
                  -
                  license
                  A
                  quality
                  A comprehensive Model Context Protocol server that enables AI assistants to interact with and manage Windows systems, providing capabilities for file system operations, process management, system information retrieval, registry operations, service management, network diagnostics, and performance monitoring.
                  Last updated -
                  7
                  2

                View all related MCP servers

                MCP directory API

                We provide all the information about MCP servers via our MCP API.

                curl -X GET 'https://glama.ai/api/mcp/v1/servers/CursorTouch/Windows-MCP'

                If you have feedback or need assistance with the MCP directory API, please join our Discord server