Windows MCP ist ein schlankes Open-Source-Projekt, das eine nahtlose Integration zwischen KI-Agenten und dem Windows-Betriebssystem ermöglicht. Als MCP-Server schließt es die Lücke zwischen LLMs und dem Windows-Betriebssystem und ermöglicht Agenten die Durchführung von Aufgaben wie Dateinavigation, Anwendungssteuerung, UI-Interaktion, Qualitätssicherungstests und mehr.
https://github.com/user-attachments/assets/45976f41-7dac-47f3-93a2-2b867feb9433
✨ Hauptmerkmale
- Nahtlose Windows-Integration
Interagiert nativ mit Windows-UI-Elementen, öffnet Apps, steuert Fenster, simuliert Benutzereingaben und mehr. - Verwenden Sie beliebige LLMs (Vision optional) . Anders als viele Automatisierungstools verlässt sich Windows MCP nicht auf herkömmliche Computer-Vision-Techniken oder bestimmte, fein abgestimmte Modelle. Es funktioniert mit beliebigen LLMs, wodurch die Komplexität und die Einrichtungszeit reduziert werden.
- Umfangreiches Toolset für die UI-Automatisierung
Enthält Tools für die grundlegende Tastatur- und Mausbedienung sowie zum Erfassen des Fenster-/UI-Status. - Leichtgewichtig und Open Source
Minimale Abhängigkeiten und einfache Einrichtung mit vollständigem Quellcode, der unter der MIT-Lizenz verfügbar ist. - Anpassbar und erweiterbar
Passen Sie Tools einfach an oder erweitern Sie sie, um sie Ihren individuellen Automatisierungs- oder KI-Integrationsanforderungen anzupassen. - Echtzeit-Interaktion
Die typische Latenz zwischen Aktionen (z. B. von einem Mausklick zum nächsten) beträgt 4 bis 8 Sekunden und kann je nach Anzahl der aktiven Anwendungen und Systemlast leicht variieren.
Unterstützte Betriebssysteme
- Windows 10
- Windows 11
Installation
Voraussetzungen
- Python 3.12+
- Anthropic Claude Desktop-App oder andere MCP-Clients
- UV (Python-Paketmanager), Installation mit
pip install uv
🏁 Erste Schritte
- Klonen Sie das Repository.
- Installieren Sie Abhängigkeiten:
- Stellen Sie eine Verbindung zum MCP-Server her
Kopieren Sie das folgende JSON mit den entsprechenden {{PATH}}-Werten:
Für Claude speichern Sie dies als claude_desktop_config.json in Ihrem Claude Desktop-Konfigurationsverzeichnis unter:
- Starten Sie Claude Desktop neu
Öffnen Sie Claude Desktop. Windows-MCP sollte jetzt als verfügbare Integration angezeigt werden.
Weitere Informationen zur Fehlerbehebung bei der Claude Desktop-Integration finden Sie in der MCP-Dokumentation . Die Dokumentation enthält hilfreiche Tipps zum Überprüfen von Protokollen und zum Beheben häufiger Probleme.
🛠️MCP-Tools
Claude kann auf die folgenden Tools zugreifen, um mit Windows zu interagieren:
Click-Tool
: Klicken Sie auf die angegebenen Koordinaten auf dem Bildschirm.Type-Tool
: Geben Sie Text in ein Element ein (löscht optional vorhandenen Text).Clipboard-Tool
: Kopieren oder Einfügen mithilfe der Systemzwischenablage.Scroll-Tool
: Nach oben/unten scrollen.Drag-Tool
: Von einem Punkt zum anderen ziehen.Move-Tool
: Mauszeiger bewegen.Shortcut-Tool
: Drücken Sie Tastaturkurzbefehle (Ctrl+c
,Alt+Tab
usw.).Key-Tool
: Drücken Sie eine einzelne Taste.Wait-Tool
: Pause für eine definierte Dauer.State-Tool
: Kombinierter Snapshot aktiver Apps und interaktiver UI-Elemente.Screenshot-Tool
: Machen Sie einen Screenshot des Desktops.Launch-Tool
: Zum Starten einer Anwendung über das Startmenü.Shell-Tool
: Zum Ausführen von PowerShell-Befehlen.
⚠️Vorsicht
Dieses MCP interagiert direkt mit Ihrem Windows-Betriebssystem, um Aktionen auszuführen. Verwenden Sie es mit Vorsicht und vermeiden Sie den Einsatz in Umgebungen, in denen solche Risiken nicht toleriert werden können.
🪪Lizenz
Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der Datei LICENSE .
🤝Beitrag
Beiträge sind willkommen! Einrichtungsanweisungen und Entwicklungsrichtlinien finden Sie unter „MITWIRKEN“ .
Mit ❤️ von Jeomon George
This server cannot be installed
Ein leichtgewichtiger Server, der KI-Agenten die Interaktion mit dem Windows-Betriebssystem ermöglicht und so Dateinavigation, Anwendungssteuerung, UI-Interaktion und QA-Tests über verschiedene Tools ermöglicht.
Related MCP Servers
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI clients to interact with virtual Ubuntu desktops, allowing them to browse the web, run code, and control instances through mouse/keyboard actions and bash commands.Last updated -59JavaScriptMIT License
- -securityAlicense-qualityA Model Context Protocol server that enables AI agents to interact with ClickUp workspaces, allowing task creation, management, and workspace organization through natural language commands.Last updated -376MIT License
- -securityFlicense-qualityA server that enables AI systems to browse, retrieve content from, and interact with web pages through the Model Context Protocol.Last updated -
- -securityFlicense-qualityA lightweight server that enables AI assistants like Cursor & Claude to read from and write to Obsidian vaults, allowing actions like creating notes, checking existing content, and managing todos through natural language.Last updated -1928TypeScript