Mobile Next - 用于移动开发和自动化的 MCP 服务器 | iOS、Android、模拟器、仿真器和物理设备
这是一个模型上下文协议 (MCP) 服务器,它支持可扩展的移动自动化开发,通过与平台无关的接口进行开发,无需具备 iOS 或 Android 知识。您可以在模拟器、仿真器和实体设备(iOS 和 Android)上运行它。该服务器允许代理和 LLM 通过结构化的无障碍快照或基于屏幕截图的坐标点击操作与原生 iOS/Android 应用程序和设备进行交互。
https://github.com/user-attachments/assets/c4e89c4f-cc71-4424-8184-bdbc8c638fa1
🚀 移动 MCP 路线图:构建移动的未来
加入我们,持续增强移动 MCP!查看我们详细的路线图,了解即将推出的功能、改进和里程碑。您的反馈对于塑造移动自动化的未来至关重要。
主要用例
我们如何帮助扩展移动自动化:
- 📲 用于测试或数据输入场景的本机应用程序自动化(iOS 和 Android)。
- 📝 无需手动控制模拟器/仿真器或物理设备(iPhone、三星、Google Pixel 等)即可编写脚本流程并形成交互
- 🧭 由 LLM 驱动的自动化多步骤用户旅程
- 👆 基于代理框架的通用移动应用程序交互
- 🤖 支持代理与代理之间的通信,用于移动自动化用例和数据提取
主要特点
- 🚀快速轻量:在大多数交互中使用本机可访问性树,或在 a11y 标签不可用时使用基于屏幕截图的坐标。
- 🤖 LLM 友好:辅助功能(快照)不需要计算机视觉模型。
- 🧿视觉感知:评估并分析屏幕上实际渲染的内容,以决定下一步操作。如果无障碍数据或视图层次结构坐标不可用,则回退到基于屏幕截图的分析。
- 📊确定性工具应用程序:尽可能依赖结构化数据,减少纯基于屏幕截图的方法中发现的歧义。
- 📺提取结构化数据:使您能够从屏幕上可见的任何内容中提取结构化数据。
🏗️ 移动 MCP 架构
📚 维基页面
有关设置、配置和调试相关问题的更多详细信息,请参阅我们的wiki 页面。
安装和配置
使用 Cursor、Claude、VS Code、Github Copilot 设置我们的 MCP:
🛠️ 如何使用📝
将 MCP 服务器添加到您的 IDE/客户端后,您可以指示您的 AI 助手使用可用的工具。例如,在 Cursor 的代理模式下,您可以使用以下提示快速验证、测试和迭代 UI 交互,读取屏幕上的信息,并执行复杂的工作流程。请描述清晰,直截了当。
✨ 示例提示
工作流程
您可以在单个提示中指定详细的工作流程,验证业务逻辑,设置自动化。您可以尽情发挥:
搜索视频、评论、点赞并分享。
下载成功的计步器应用程序,注册,设置锻炼并启动应用程序
在 Substack 中搜索、阅读、突出显示、评论和保存文章
预订健身课程,设置计时器
查找本地活动,设置日历活动
查看天气预报并发送 Whatsapp/Telegram/Slack 消息
- 在 Zoom 中安排会议并通过电子邮件分享邀请
先决条件
将 MCP 与您的代理和移动设备连接起来需要:
- Xcode 命令行工具
- Android 平台工具
- 节点.js
- MCP支持基础模型或代理,例如Claude MCP 、 OpenAI Agent SDK 、 Copilot Studio
模拟器、仿真器和物理设备
启动后,移动 MCP 可以连接到:
- macOS/Linux 上的 iOS 模拟器
- Linux/Windows/macOS 上的 Android 模拟器
- 物理 iOS 或 Android 设备(需要适当的平台工具和驱动程序)
在运行 Mobile Next Mobile MCP 之前,请确保已安装并正确配置了移动平台 SDK(Xcode、Android SDK)。
在模拟器/仿真器上以“无头”模式运行
当您的机器上没有连接实体电话时,您可以在后台使用模拟器或模拟器运行 Mobile MCP。
例如,在 Android 上:
- 启动模拟器(avdmanager/emulator 命令)。
- 使用所需标志运行 Mobile MCP
在 iOS 上,您需要 Xcode 并运行模拟器,然后才能将 Mobile MCP 与该模拟器实例一起使用。
xcrun simctl list
xcrun simctl boot "iPhone 16"
感谢所有贡献者❤️
我们感谢所有帮助改进这个项目的人。
You must be authenticated.
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Tools
模型上下文协议服务器通过适用于 iOS 和 Android 设备的平台无关界面实现可扩展的移动自动化,允许代理和 LLM 使用可访问性快照或基于坐标的交互与移动应用程序进行交互。
Related Resources
Related MCP Servers
- -securityAlicense-qualityA Model Context Protocol server that provides desktop automation capabilities using RobotJS and screenshot capabilities, enabling LLMs to control mouse movements, keyboard inputs, and capture screenshots of the desktop environment.Last updated -422JavaScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server that enables AI assistants to control and interact with Android devices, allowing for device management, app debugging, system analysis, and UI automation through natural language commands.Last updated -29143PythonApache 2.0
- -securityAlicense-qualityA Model Context Protocol server that enables AI assistants to interact with Android devices through ADB, allowing for automated device management, app installation, file transfers, and screenshot capture.Last updated -112JavaScriptISC License
- -securityAlicense-qualityA Model Context Protocol server that enables LLMs to interact with web pages through structured accessibility snapshots, providing browser automation capabilities without requiring screenshots or visually-tuned models.Last updated -TypeScriptApache 2.0