Integrations
Provides tools to control and automate Android devices through uiautomator2, enabling app management, UI interactions (tapping, swiping, scrolling), screenshot capture, device monitoring, and more
Supports integration with GitHub Copilot Chat, allowing it to control Android devices and perform automation tasks through natural language
Agente Android de MCP
Este proyecto proporciona un servidor MCP (Protocolo de Contexto de Modelo) para automatizar dispositivos Android mediante uiautomator2 . Está diseñado para integrarse fácilmente con agentes de IA como GitHub Copilot Chat, Claude o Open Interpreter para controlar dispositivos Android mediante lenguaje natural.
Demostración rápida
Requisitos
- Python 3.13 o superior
- Android Debug Bridge (adb) instalado y en PATH
- Dispositivo Android conectado con depuración USB habilitada
- Dispositivo Android compatible con uiautomator2
Características
- Iniciar, detener y administrar aplicaciones por nombre de paquete
- Recuperar aplicaciones instaladas y la aplicación actual en primer plano
- Toque, deslice, desplácese, arrastre y realice interacciones de IU
- Obtenga información del dispositivo, resolución de pantalla, estado de la batería y más
- Capturar capturas de pantalla o los últimos mensajes de brindis
- Desbloquear, activar o suspender la pantalla programáticamente
- Borrar los datos de la aplicación y esperar las actividades
- Incluye un control de salud y una herramienta de diagnóstico
adb
Casos de uso
Perfecto para:
- Agentes de IA que necesitan interactuar con dispositivos reales
- Configuraciones de control de dispositivos remotos
- Herramientas de control de calidad automatizadas
- Marcos de bots de Android
- Pruebas y automatización de UI
- Gestión y monitorización de dispositivos
Instalación
1. Clonar el repositorio
2. Crear y activar el entorno virtual
3. Instalar dependencias
Ejecución del servidor
Opción 1: Usar uvicorn (recomendado)
Opción 2: Usar MCP stdio (para la integración del agente de IA)
Uso
Se necesita un cliente MCP para usar este servidor. La aplicación Claude Desktop es un ejemplo de cliente MCP. Para usar este servidor con Claude Desktop:
Localice su archivo de configuración de Claude Desktop
- Ventanas:
%APPDATA%\Claude\claude_desktop_config.json
- macOS:
~/Library/Application Support/Claude/claude_desktop_config.json
Agregue la configuración del servidor MCP de Android a la sección mcpServers
Reemplace /path/to/mcp-adb
con la ruta absoluta donde clonó este repositorio. Por ejemplo: /Users/username/Projects/mcp-adb
Uso con VS Code
También puedes usar este servidor MCP con el modo agente de VS Code (requiere VS Code 1.99 o posterior). Para configurarlo:
- Crea un archivo
.vscode/mcp.json
en tu espacio de trabajo:
Reemplace /path/to/mcp-adb
con la ruta absoluta a donde clonó este repositorio.
Después de agregar la configuración, puede administrar el servidor mediante:
- Paleta de comandos →
MCP: List Servers
para ver y administrar servidores configurados - Paleta de comandos →
MCP: Start Server
para iniciar el servidor - Las herramientas del servidor estarán disponibles en el chat del modo agente de VS Code
Inspector de interfaz de usuario
El proyecto incluye soporte para uiauto.dev, una poderosa herramienta de inspección de UI para ver y analizar la estructura de la interfaz de su dispositivo.
- Instalar el inspector de UI:
- Iniciar el inspector:
- Abra su navegador y navegue a https://uiauto.dev
Herramientas MCP disponibles
Nombre de la herramienta | Descripción |
---|---|
mcp_health | Compruebe si el servidor MCP está funcionando correctamente |
connect_device | Conéctese a un dispositivo Android y obtenga información básica |
get_installed_apps | Lista de todas las aplicaciones instaladas con información de la versión y el paquete |
get_current_app | Obtenga información sobre la aplicación que se encuentra actualmente en primer plano |
start_app | Iniciar una aplicación por el nombre de su paquete |
stop_app | Detener una aplicación por su nombre de paquete |
stop_all_apps | Detener todas las aplicaciones que se estén ejecutando actualmente |
screen_on | Encender la pantalla |
screen_off | Apaga la pantalla |
get_device_info | Obtenga información detallada del dispositivo: serie, resolución, batería, etc. |
press_key | Simular la pulsación de teclas de hardware (por ejemplo, home , back , menu , etc.) |
unlock_screen | Desbloquear la pantalla (enciéndela y deslízala si es necesario) |
check_adb | Compruebe si ADB está instalado y enumere los dispositivos conectados |
wait_for_screen_on | Esperar asincrónicamente hasta que se encienda la pantalla |
click | Toque un elemento por text , resourceId o description |
long_click | Realizar un clic largo sobre un elemento |
send_text | Ingrese texto en el campo actualmente enfocado (opcionalmente, borre primero) |
get_element_info | Obtenga información sobre los elementos de la interfaz de usuario (texto, límites, elementos en los que se puede hacer clic, etc.) |
swipe | Desliza el dedo de una coordenada a otra |
wait_for_element | Esperar a que aparezca un elemento en la pantalla |
screenshot | Tomar y guardar una captura de pantalla del dispositivo |
scroll_to | Desplácese hasta que un elemento determinado se vuelva visible |
drag | Arrastre un elemento a una ubicación específica de la pantalla |
get_toast | Obtener el último mensaje de brindis que se muestra en la pantalla |
clear_app_data | Borrar datos de usuario/caché de una aplicación específica |
wait_activity | Esperar hasta que aparezca una actividad específica |
dump_hierarchy | Volcar la jerarquía de la interfaz de usuario de la pantalla actual como XML |
Licencia
Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Un servidor de protocolo de contexto de modelo que permite a los agentes de IA controlar y automatizar dispositivos Android a través del lenguaje natural, respaldando acciones como la administración de aplicaciones, interacciones de UI y monitoreo de dispositivos.
Related MCP Servers
- -securityAlicense-qualityA Model Context Protocol server enabling AI agents to access and manipulate ServiceNow data through natural language interactions, allowing users to search for records, update them, and manage scripts.Last updated -9PythonMIT License
- -securityFlicense-qualityA versatile Model Context Protocol server that enables AI assistants to manage calendars, track tasks, handle emails, search the web, and control smart home devices.Last updated -2Python
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server that enables AI assistants to control and interact with Android devices, allowing for device management, app debugging, system analysis, and UI automation through natural language commands.Last updated -2930PythonApache 2.0
- -securityAlicense-qualityA Model Context Protocol server that enables AI assistants to interact with Android devices through ADB, allowing for automated device management, app installation, file transfers, and screenshot capture.Last updated -112JavaScriptISC License