MCP Android Agent
Dieses Projekt bietet einen MCP-Server (Model Context Protocol) zur Automatisierung von Android-Geräten mit uiautomator2 . Er lässt sich problemlos in KI-Agenten wie GitHub Copilot Chat, Claude oder Open Interpreter integrieren, um Android-Geräte über natürliche Sprache zu steuern.
Schnelle Demo


Related MCP server: Android ADB MCP Server
Anforderungen
Python 3.13 oder höher
Android Debug Bridge (adb) installiert und im PATH
Verbundenes Android-Gerät mit aktiviertem USB-Debugging
uiautomator2- kompatibles Android-Gerät
Merkmale
Starten, Stoppen und Verwalten von Apps nach Paketnamen
Installierte Apps und aktuelle Vordergrund-App abrufen
Tippen, wischen, scrollen, ziehen und UI-Interaktionen durchführen
Erhalten Sie Geräteinformationen, Bildschirmauflösung, Akkustatus und mehr
Erfassen Sie Screenshots oder letzte Toast-Nachrichten
Bildschirm programmgesteuert entsperren, aktivieren oder in den Ruhezustand versetzen
App-Daten löschen und auf Aktivitäten warten
Enthält einen Gesundheitscheck und
adbDiagnosetool
Anwendungsfälle
Perfekt für:
KI-Agenten, die mit realen Geräten interagieren müssen
Remote-Gerätesteuerungs-Setups
Automatisierte QA-Tools
Android-Bot-Frameworks
UI-Tests und Automatisierung
Geräteverwaltung und -überwachung
Installation
1. Klonen Sie das Repo
2. Virtuelle Umgebung erstellen und aktivieren
3. Abhängigkeiten installieren
Ausführen des Servers
Option 1: Verwendung von uvicorn (empfohlen)
Option 2: Verwenden von MCP stdio (für die Integration von KI-Agenten)
Verwendung
Zur Nutzung dieses Servers ist ein MCP-Client erforderlich. Die Claude Desktop-App ist ein Beispiel für einen MCP-Client. So nutzen Sie diesen Server mit Claude Desktop:
Suchen Sie Ihre Claude Desktop-Konfigurationsdatei
Windows:
%APPDATA%\Claude\claude_desktop_config.jsonmacOS:
~/Library/Application Support/Claude/claude_desktop_config.json
Fügen Sie die Android MCP-Serverkonfiguration zum Abschnitt mcpServers hinzu
Ersetzen Sie /path/to/mcp-adb durch den absoluten Pfad zum geklonten Repository. Beispiel: /Users/username/Projects/mcp-adb
Verwendung mit VS Code
Sie können diesen MCP-Server auch im Agentenmodus von VS Code verwenden (erfordert VS Code 1.99 oder neuer). So richten Sie ihn ein:
Erstellen Sie eine
.vscode/mcp.json-Datei in Ihrem Arbeitsbereich:
Ersetzen Sie /path/to/mcp-adb durch den absoluten Pfad, unter dem Sie dieses Repository geklont haben.
Nachdem Sie die Konfiguration hinzugefügt haben, können Sie den Server wie folgt verwalten:
Befehlspalette →
MCP: List Serverszum Anzeigen und Verwalten konfigurierter ServerBefehlspalette →
MCP: Start Server, um den Server zu startenDie Tools des Servers werden im Agentenmodus-Chat von VS Code verfügbar sein

UI-Inspektor
Das Projekt umfasst Unterstützung für uiauto.dev, ein leistungsstarkes UI-Inspektionstool zum Anzeigen und Analysieren der Schnittstellenstruktur Ihres Geräts.
Installieren Sie den UI-Inspektor:
Starten Sie den Inspektor:
Öffnen Sie Ihren Browser und navigieren Sie zu https://uiauto.dev

Verfügbare MCP-Tools
Werkzeugname | Beschreibung |
| Überprüfen Sie, ob der MCP-Server ordnungsgemäß läuft |
| Stellen Sie eine Verbindung zu einem Android-Gerät her und erhalten Sie grundlegende Informationen |
| Listen Sie alle installierten Apps mit Versions- und Paketinformationen auf |
| Erhalten Sie Informationen über die App, die gerade im Vordergrund ist |
| Starten Sie eine App anhand ihres Paketnamens |
| Stoppen einer App anhand ihres Paketnamens |
| Stoppen Sie alle derzeit laufenden Apps |
| Schalten Sie den Bildschirm ein |
| Schalten Sie den Bildschirm aus |
| Erhalten Sie detaillierte Geräteinformationen: Seriennummer, Auflösung, Akku usw. |
| Simulieren Sie das Drücken einer Hardwaretaste (z. B.
,
,
usw.). |
| Bildschirm entsperren (einschalten und ggf. wischen) |
| Überprüfen Sie, ob ADB installiert ist, und listen Sie die verbundenen Geräte auf |
| Asynchron warten bis der Bildschirm eingeschaltet wird |
| Tippen Sie auf ein Element nach
,
oder
|
| Führen Sie einen langen Klick auf ein Element aus |
| Geben Sie Text in das aktuell fokussierte Feld ein (optional vorher löschen) |
| Erhalten Sie Informationen zu UI-Elementen (Text, Grenzen, anklickbar usw.). |
| Wischen Sie von einer Koordinate zur anderen |
| Warten Sie, bis ein Element auf dem Bildschirm erscheint |
| Machen und speichern Sie einen Screenshot vom Gerät |
| Scrollen Sie, bis ein bestimmtes Element sichtbar wird |
| Ziehen Sie ein Element an eine bestimmte Stelle auf dem Bildschirm |
| Holen Sie sich die letzte Toast-Nachricht, die auf dem Bildschirm angezeigt wird |
| Benutzerdaten/Cache einer bestimmten App löschen |
| Warten Sie, bis eine bestimmte Aktivität angezeigt wird |
| Dumpen Sie die UI-Hierarchie des aktuellen Bildschirms als XML |
Lizenz
Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der Datei LICENSE .