Mobile Next: servidor MCP para desarrollo y automatización móvil | iOS, Android, simulador, emulador y dispositivos físicos
Este es un servidor de Protocolo de Contexto de Modelo (MCP) que permite la automatización móvil escalable y el desarrollo mediante una interfaz independiente de la plataforma, eliminando la necesidad de conocimientos específicos de iOS o Android. Puede ejecutarse en emuladores, simuladores y dispositivos físicos (iOS y Android). Este servidor permite a los agentes y LLM interactuar con aplicaciones y dispositivos nativos de iOS/Android mediante instantáneas de accesibilidad estructuradas o toques basados en coordenadas a partir de capturas de pantalla.
https://github.com/user-attachments/assets/c4e89c4f-cc71-4424-8184-bdbc8c638fa1
Hoja de ruta de MCP móvil: construyendo el futuro de la tecnología móvil
¡Únete a nosotros en nuestro viaje para mejorar continuamente Mobile MCP! Consulta nuestra hoja de ruta detallada para ver las próximas funciones, mejoras y logros. Tus comentarios son invaluables para definir el futuro de la automatización móvil.
Principales casos de uso
Cómo ayudamos a escalar la automatización móvil:
- 📲 Automatización de aplicaciones nativas (iOS y Android) para escenarios de prueba o ingreso de datos.
- 📝 Flujos con scripts e interacciones de formularios sin controlar manualmente simuladores/emuladores o dispositivos físicos (iPhone, Samsung, Google Pixel, etc.)
- 🧭 Automatizar recorridos de usuario de varios pasos impulsados por un LLM
- 👆 Interacción de aplicaciones móviles de propósito general para marcos basados en agentes
- 🤖 Permite la comunicación entre agentes para casos de uso de automatización móvil y extracción de datos.
Características principales
- 🚀 Rápido y liviano : utiliza árboles de accesibilidad nativos para la mayoría de las interacciones o coordenadas basadas en capturas de pantalla donde las etiquetas a11y no están disponibles.
- Compatible con LLM : no se requiere un modelo de visión por computadora en Accesibilidad (Instantánea).
- 🧿 Visual Sense : Evalúa y analiza lo que se muestra en pantalla para decidir la siguiente acción. Si no se dispone de datos de accesibilidad ni de coordenadas de la jerarquía de vistas, recurre al análisis basado en capturas de pantalla.
- 📊 Aplicación de herramientas deterministas : reduce la ambigüedad que se encuentra en los enfoques basados puramente en capturas de pantalla al confiar en datos estructurados siempre que sea posible.
- 📺 Extraer datos estructurados : le permite extraer datos estructurados de cualquier cosa visible en la pantalla.
🏗️ Arquitectura MCP móvil
📚 Página wiki
Más detalles en nuestra página wiki para preguntas relacionadas con la configuración, instalación y depuración.
Instalación y configuración
Configurar nuestro MCP con Cursor, Claude, VS Code, Github Copilot:
🛠️ Cómo usar 📝
Tras añadir el servidor MCP a tu IDE/cliente, puedes indicar a tu asistente de IA que use las herramientas disponibles. Por ejemplo, en el modo agente de Cursor, puedes usar las siguientes indicaciones para validar, probar e iterar rápidamente las interacciones de la interfaz de usuario, leer información de la pantalla y ejecutar flujos de trabajo complejos. Sé descriptivo y directo.
✨ Ejemplos de indicaciones
Flujos de trabajo
Puedes especificar flujos de trabajo detallados en una sola solicitud, verificar la lógica de negocio y configurar automatizaciones. ¡Puedes darlo todo!
Busca un vídeo, comenta, dale me gusta y compártelo.
Descargue una aplicación de contador de pasos exitosa, regístrese, configure el entrenamiento e inicie la aplicación.
Busca en Substack, lee, resalta, comenta y guarda un artículo
Reserva una clase de entrenamiento, configura el temporizador
Encuentre un evento local, configure un evento en el calendario
Consulta el pronóstico del tiempo y envía un mensaje de WhatsApp/Telegram/Slack
- Programe una reunión en Zoom y comparta la invitación por correo electrónico
Prerrequisitos
Lo que necesitarás para conectar MCP con tu agente y dispositivos móviles:
- Herramientas de línea de comandos de Xcode
- Herramientas de la plataforma Android
- nodo.js
- Modelos o agentes fundamentales compatibles con MCP , como Claude MCP , OpenAI Agent SDK y Copilot Studio
Simuladores, emuladores y dispositivos físicos
Una vez iniciado, Mobile MCP puede conectarse a:
- Simuladores de iOS en macOS/Linux
- Emuladores de Android en Linux/Windows/macOS
- Dispositivos físicos iOS o Android (requiere herramientas y controladores de plataforma adecuados)
Asegúrese de tener los SDK de su plataforma móvil (Xcode, Android SDK) instalados y configurados correctamente antes de ejecutar Mobile Next Mobile MCP.
Ejecución en modo "sin cabeza" en simuladores/emuladores
Cuando no tienes un teléfono físico conectado a tu máquina, puedes ejecutar Mobile MCP con un emulador o simulador en segundo plano.
Por ejemplo, en Android:
- Inicie un emulador (comando avdmanager / emulator).
- Ejecute Mobile MCP con las banderas deseadas
En iOS, necesitarás Xcode y ejecutar el Simulador antes de usar Mobile MCP con esa instancia del simulador.
xcrun simctl list
xcrun simctl boot "iPhone 16"
Gracias a todos los colaboradores ❤️
Agradecemos a todos los que han ayudado a mejorar este proyecto.
You must be authenticated.
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Tools
Un servidor de protocolo de contexto de modelo que permite la automatización móvil escalable a través de una interfaz independiente de la plataforma para dispositivos iOS y Android, lo que permite a los agentes y LLM interactuar con aplicaciones móviles utilizando instantáneas de accesibilidad o interacciones basadas en coordenadas.
- Hoja de ruta de MCP móvil: construyendo el futuro de la tecnología móvil
- Principales casos de uso
- Características principales
- 🏗️ Arquitectura MCP móvil
- 📚 Página wiki
- Instalación y configuración
- Prerrequisitos
- Gracias a todos los colaboradores ❤️
Related Resources
Related MCP Servers
- -securityAlicense-qualityA Model Context Protocol server that provides desktop automation capabilities using RobotJS and screenshot capabilities, enabling LLMs to control mouse movements, keyboard inputs, and capture screenshots of the desktop environment.Last updated -422JavaScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server that enables AI assistants to control and interact with Android devices, allowing for device management, app debugging, system analysis, and UI automation through natural language commands.Last updated -29143PythonApache 2.0
- -securityAlicense-qualityA Model Context Protocol server that enables AI assistants to interact with Android devices through ADB, allowing for automated device management, app installation, file transfers, and screenshot capture.Last updated -112JavaScriptISC License
- -securityAlicense-qualityA Model Context Protocol server that enables LLMs to interact with web pages through structured accessibility snapshots, providing browser automation capabilities without requiring screenshots or visually-tuned models.Last updated -TypeScriptApache 2.0