MCP Android Agent
Dieses Projekt bietet einen MCP-Server (Model Context Protocol) zur Automatisierung von Android-Geräten mit uiautomator2 . Er lässt sich problemlos in KI-Agenten wie GitHub Copilot Chat, Claude oder Open Interpreter integrieren, um Android-Geräte über natürliche Sprache zu steuern.
Schnelle Demo


Anforderungen
Python 3.13 oder höher
Android Debug Bridge (adb) installiert und im PATH
Verbundenes Android-Gerät mit aktiviertem USB-Debugging
uiautomator2- kompatibles Android-Gerät
Merkmale
Starten, Stoppen und Verwalten von Apps nach Paketnamen
Installierte Apps und aktuelle Vordergrund-App abrufen
Tippen, wischen, scrollen, ziehen und UI-Interaktionen durchführen
Erhalten Sie Geräteinformationen, Bildschirmauflösung, Akkustatus und mehr
Erfassen Sie Screenshots oder letzte Toast-Nachrichten
Bildschirm programmgesteuert entsperren, aktivieren oder in den Ruhezustand versetzen
App-Daten löschen und auf Aktivitäten warten
Enthält einen Gesundheitscheck und
adbDiagnosetool
Anwendungsfälle
Perfekt für:
KI-Agenten, die mit realen Geräten interagieren müssen
Remote-Gerätesteuerungs-Setups
Automatisierte QA-Tools
Android-Bot-Frameworks
UI-Tests und Automatisierung
Geräteverwaltung und -überwachung
Installation
1. Klonen Sie das Repo
2. Virtuelle Umgebung erstellen und aktivieren
3. Abhängigkeiten installieren
Ausführen des Servers
Option 1: Verwendung von uvicorn (empfohlen)
Option 2: Verwenden von MCP stdio (für die Integration von KI-Agenten)
Verwendung
Zur Nutzung dieses Servers ist ein MCP-Client erforderlich. Die Claude Desktop-App ist ein Beispiel für einen MCP-Client. So nutzen Sie diesen Server mit Claude Desktop:
Suchen Sie Ihre Claude Desktop-Konfigurationsdatei
Windows:
%APPDATA%\Claude\claude_desktop_config.jsonmacOS:
~/Library/Application Support/Claude/claude_desktop_config.json
Fügen Sie die Android MCP-Serverkonfiguration zum Abschnitt mcpServers hinzu
Ersetzen Sie /path/to/mcp-adb durch den absoluten Pfad zum geklonten Repository. Beispiel: /Users/username/Projects/mcp-adb
Verwendung mit VS Code
Sie können diesen MCP-Server auch im Agentenmodus von VS Code verwenden (erfordert VS Code 1.99 oder neuer). So richten Sie ihn ein:
Erstellen Sie eine
.vscode/mcp.json-Datei in Ihrem Arbeitsbereich:
Ersetzen Sie /path/to/mcp-adb durch den absoluten Pfad, unter dem Sie dieses Repository geklont haben.
Nachdem Sie die Konfiguration hinzugefügt haben, können Sie den Server wie folgt verwalten:
Befehlspalette →
MCP: List Serverszum Anzeigen und Verwalten konfigurierter ServerBefehlspalette →
MCP: Start Server, um den Server zu startenDie Tools des Servers werden im Agentenmodus-Chat von VS Code verfügbar sein

UI-Inspektor
Das Projekt umfasst Unterstützung für uiauto.dev, ein leistungsstarkes UI-Inspektionstool zum Anzeigen und Analysieren der Schnittstellenstruktur Ihres Geräts.
Installieren Sie den UI-Inspektor:
Starten Sie den Inspektor:
Öffnen Sie Ihren Browser und navigieren Sie zu https://uiauto.dev

Verfügbare MCP-Tools
Werkzeugname | Beschreibung |
| Überprüfen Sie, ob der MCP-Server ordnungsgemäß läuft |
| Stellen Sie eine Verbindung zu einem Android-Gerät her und erhalten Sie grundlegende Informationen |
| Listen Sie alle installierten Apps mit Versions- und Paketinformationen auf |
| Erhalten Sie Informationen über die App, die gerade im Vordergrund ist |
| Starten Sie eine App anhand ihres Paketnamens |
| Stoppen einer App anhand ihres Paketnamens |
| Stoppen Sie alle derzeit laufenden Apps |
| Schalten Sie den Bildschirm ein |
| Schalten Sie den Bildschirm aus |
| Erhalten Sie detaillierte Geräteinformationen: Seriennummer, Auflösung, Akku usw. |
| Simulieren Sie das Drücken einer Hardwaretaste (z. B.
,
,
usw.). |
| Bildschirm entsperren (einschalten und ggf. wischen) |
| Überprüfen Sie, ob ADB installiert ist, und listen Sie die verbundenen Geräte auf |
| Asynchron warten bis der Bildschirm eingeschaltet wird |
| Tippen Sie auf ein Element nach
,
oder
|
| Führen Sie einen langen Klick auf ein Element aus |
| Geben Sie Text in das aktuell fokussierte Feld ein (optional vorher löschen) |
| Erhalten Sie Informationen zu UI-Elementen (Text, Grenzen, anklickbar usw.). |
| Wischen Sie von einer Koordinate zur anderen |
| Warten Sie, bis ein Element auf dem Bildschirm erscheint |
| Machen und speichern Sie einen Screenshot vom Gerät |
| Scrollen Sie, bis ein bestimmtes Element sichtbar wird |
| Ziehen Sie ein Element an eine bestimmte Stelle auf dem Bildschirm |
| Holen Sie sich die letzte Toast-Nachricht, die auf dem Bildschirm angezeigt wird |
| Benutzerdaten/Cache einer bestimmten App löschen |
| Warten Sie, bis eine bestimmte Aktivität angezeigt wird |
| Dumpen Sie die UI-Hierarchie des aktuellen Bildschirms als XML |
Lizenz
Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der Datei LICENSE .
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Ein Model Context Protocol-Server, der es KI-Agenten ermöglicht, Android-Geräte über natürliche Sprache zu steuern und zu automatisieren und Aktionen wie App-Verwaltung, UI-Interaktionen und Geräteüberwachung zu unterstützen.
Related MCP Servers
- Asecurity-licenseAqualityA Model Context Protocol (MCP) server that enables AI assistants to control and interact with Android devices, allowing for device management, app debugging, system analysis, and UI automation through natural language commands.Last updated -8243Apache 2.0
- -security-license-qualityA Model Context Protocol server that enables AI assistants to interact with Android devices through ADB, allowing for automated device management, app installation, file transfers, and screenshot capture.Last updated -5327ISC License
- Asecurity-licenseAqualityA Model Context Protocol server that enables AI agents to generate, fetch, and manage UI components through natural language interactions.Last updated -3216
- Asecurity-licenseAqualityA Model Context Protocol server that enables scalable mobile automation through a platform-agnostic interface for iOS and Android devices, allowing agents and LLMs to interact with mobile applications using accessibility snapshots or coordinate-based interactions.Last updated -174,2542,305Apache 2.0