MCP Android Agent

by nim444

Integrations

  • Provides tools to control and automate Android devices through uiautomator2, enabling app management, UI interactions (tapping, swiping, scrolling), screenshot capture, device monitoring, and more

  • Supports integration with GitHub Copilot Chat, allowing it to control Android devices and perform automation tasks through natural language

MCP Android Agent

Dieses Projekt bietet einen MCP-Server (Model Context Protocol) zur Automatisierung von Android-Geräten mit uiautomator2 . Er lässt sich problemlos in KI-Agenten wie GitHub Copilot Chat, Claude oder Open Interpreter integrieren, um Android-Geräte über natürliche Sprache zu steuern.

Schnelle Demo


Anforderungen

  • Python 3.13 oder höher
  • Android Debug Bridge (adb) installiert und im PATH
  • Verbundenes Android-Gerät mit aktiviertem USB-Debugging
  • uiautomator2- kompatibles Android-Gerät

Merkmale

  • Starten, Stoppen und Verwalten von Apps nach Paketnamen
  • Installierte Apps und aktuelle Vordergrund-App abrufen
  • Tippen, wischen, scrollen, ziehen und UI-Interaktionen durchführen
  • Erhalten Sie Geräteinformationen, Bildschirmauflösung, Akkustatus und mehr
  • Erfassen Sie Screenshots oder letzte Toast-Nachrichten
  • Bildschirm programmgesteuert entsperren, aktivieren oder in den Ruhezustand versetzen
  • App-Daten löschen und auf Aktivitäten warten
  • Enthält einen Gesundheitscheck und adb Diagnosetool

Anwendungsfälle

Perfekt für:

  • KI-Agenten, die mit realen Geräten interagieren müssen
  • Remote-Gerätesteuerungs-Setups
  • Automatisierte QA-Tools
  • Android-Bot-Frameworks
  • UI-Tests und Automatisierung
  • Geräteverwaltung und -überwachung

Installation

1. Klonen Sie das Repo

git clone https://github.com/nim444/mcp-android.git cd mcp-android

2. Virtuelle Umgebung erstellen und aktivieren

# Using uv (https://github.com/astral-sh/uv) uv venv source .venv/bin/activate # On Windows: .venv\\Scripts\\activate

3. Abhängigkeiten installieren

uv pip install

Ausführen des Servers

Option 1: Verwendung von uvicorn (empfohlen)

uvicorn server:app --factory --host 0.0.0.0 --port 8000

Option 2: Verwenden von MCP stdio (für die Integration von KI-Agenten)

python server.py

Verwendung

Zur Nutzung dieses Servers ist ein MCP-Client erforderlich. Die Claude Desktop-App ist ein Beispiel für einen MCP-Client. So nutzen Sie diesen Server mit Claude Desktop:

Suchen Sie Ihre Claude Desktop-Konfigurationsdatei

  • Windows: %APPDATA%\Claude\claude_desktop_config.json
  • macOS: ~/Library/Application Support/Claude/claude_desktop_config.json

Fügen Sie die Android MCP-Serverkonfiguration zum Abschnitt mcpServers hinzu

{ "mcpServers": { "mcp-android": { "type": "stdio", "command": "bash", "args": [ "-c", "cd /path/to/mcp-adb && source .venv/bin/activate && python -m server" ] } } }

Ersetzen Sie /path/to/mcp-adb durch den absoluten Pfad zum geklonten Repository. Beispiel: /Users/username/Projects/mcp-adb

Verwendung mit VS Code

Sie können diesen MCP-Server auch im Agentenmodus von VS Code verwenden (erfordert VS Code 1.99 oder neuer). So richten Sie ihn ein:

  1. Erstellen Sie eine .vscode/mcp.json -Datei in Ihrem Arbeitsbereich:
{ "servers": { "mcp-android": { "type": "stdio", "command": "bash", "args": [ "-c", "cd /path/to/mcp-adb && source .venv/bin/activate && python -m server" ] } } }

Ersetzen Sie /path/to/mcp-adb durch den absoluten Pfad, unter dem Sie dieses Repository geklont haben.

Nachdem Sie die Konfiguration hinzugefügt haben, können Sie den Server wie folgt verwalten:

  • Befehlspalette → MCP: List Servers zum Anzeigen und Verwalten konfigurierter Server
  • Befehlspalette → MCP: Start Server , um den Server zu starten
  • Die Tools des Servers werden im Agentenmodus-Chat von VS Code verfügbar sein

UI-Inspektor

Das Projekt umfasst Unterstützung für uiauto.dev, ein leistungsstarkes UI-Inspektionstool zum Anzeigen und Analysieren der Schnittstellenstruktur Ihres Geräts.

  1. Installieren Sie den UI-Inspektor:
uv pip install uiautodev
  1. Starten Sie den Inspektor:
uiauto.dev
  1. Öffnen Sie Ihren Browser und navigieren Sie zu https://uiauto.dev

Verfügbare MCP-Tools

WerkzeugnameBeschreibung
mcp_healthÜberprüfen Sie, ob der MCP-Server ordnungsgemäß läuft
connect_deviceStellen Sie eine Verbindung zu einem Android-Gerät her und erhalten Sie grundlegende Informationen
get_installed_appsListen Sie alle installierten Apps mit Versions- und Paketinformationen auf
get_current_appErhalten Sie Informationen über die App, die gerade im Vordergrund ist
start_appStarten Sie eine App anhand ihres Paketnamens
stop_appStoppen einer App anhand ihres Paketnamens
stop_all_appsStoppen Sie alle derzeit laufenden Apps
screen_onSchalten Sie den Bildschirm ein
screen_offSchalten Sie den Bildschirm aus
get_device_infoErhalten Sie detaillierte Geräteinformationen: Seriennummer, Auflösung, Akku usw.
press_keySimulieren Sie das Drücken einer Hardwaretaste (z. B. home , back , menu usw.).
unlock_screenBildschirm entsperren (einschalten und ggf. wischen)
check_adbÜberprüfen Sie, ob ADB installiert ist, und listen Sie die verbundenen Geräte auf
wait_for_screen_onAsynchron warten bis der Bildschirm eingeschaltet wird
clickTippen Sie auf ein Element nach text , resourceId oder description
long_clickFühren Sie einen langen Klick auf ein Element aus
send_textGeben Sie Text in das aktuell fokussierte Feld ein (optional vorher löschen)
get_element_infoErhalten Sie Informationen zu UI-Elementen (Text, Grenzen, anklickbar usw.).
swipeWischen Sie von einer Koordinate zur anderen
wait_for_elementWarten Sie, bis ein Element auf dem Bildschirm erscheint
screenshotMachen und speichern Sie einen Screenshot vom Gerät
scroll_toScrollen Sie, bis ein bestimmtes Element sichtbar wird
dragZiehen Sie ein Element an eine bestimmte Stelle auf dem Bildschirm
get_toastHolen Sie sich die letzte Toast-Nachricht, die auf dem Bildschirm angezeigt wird
clear_app_dataBenutzerdaten/Cache einer bestimmten App löschen
wait_activityWarten Sie, bis eine bestimmte Aktivität angezeigt wird
dump_hierarchyDumpen Sie die UI-Hierarchie des aktuellen Bildschirms als XML

Lizenz

Dieses Projekt ist unter der MIT-Lizenz lizenziert – Einzelheiten finden Sie in der Datei LICENSE .

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Ein Model Context Protocol-Server, der es KI-Agenten ermöglicht, Android-Geräte über natürliche Sprache zu steuern und zu automatisieren und Aktionen wie App-Verwaltung, UI-Interaktionen und Geräteüberwachung zu unterstützen.

  1. Schnelle Demo
    1. Anforderungen
      1. Merkmale
        1. Anwendungsfälle
          1. Installation
            1. 1. Klonen Sie das Repo
            2. 2. Virtuelle Umgebung erstellen und aktivieren
            3. 3. Abhängigkeiten installieren
          2. Ausführen des Servers
            1. Option 1: Verwendung von uvicorn (empfohlen)
            2. Option 2: Verwenden von MCP stdio (für die Integration von KI-Agenten)
          3. Verwendung
            1. Suchen Sie Ihre Claude Desktop-Konfigurationsdatei
            2. Fügen Sie die Android MCP-Serverkonfiguration zum Abschnitt mcpServers hinzu
            3. Verwendung mit VS Code
          4. UI-Inspektor
            1. Verfügbare MCP-Tools
              1. Lizenz

                Related MCP Servers

                • -
                  security
                  A
                  license
                  -
                  quality
                  A Model Context Protocol server enabling AI agents to access and manipulate ServiceNow data through natural language interactions, allowing users to search for records, update them, and manage scripts.
                  Last updated -
                  9
                  Python
                  MIT License
                • -
                  security
                  F
                  license
                  -
                  quality
                  A versatile Model Context Protocol server that enables AI assistants to manage calendars, track tasks, handle emails, search the web, and control smart home devices.
                  Last updated -
                  2
                  Python
                  • Apple
                  • Linux
                • A
                  security
                  A
                  license
                  A
                  quality
                  A Model Context Protocol (MCP) server that enables AI assistants to control and interact with Android devices, allowing for device management, app debugging, system analysis, and UI automation through natural language commands.
                  Last updated -
                  29
                  30
                  Python
                  Apache 2.0
                  • Linux
                  • Apple
                • -
                  security
                  A
                  license
                  -
                  quality
                  A Model Context Protocol server that enables AI assistants to interact with Android devices through ADB, allowing for automated device management, app installation, file transfers, and screenshot capture.
                  Last updated -
                  11
                  2
                  JavaScript
                  ISC License
                  • Linux
                  • Apple

                View all related MCP servers

                ID: 47cgnvx3fd