Phone MCP Plugin

by hao-cyber
Verified

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Enables controlling Android phones through ADB, allowing functions like making calls, sending messages, accessing contacts, taking screenshots, recording screens, opening apps, and performing system operations.

  • Offers specific installation instructions for Fedora users to install the required ADB tools via the package manager.

  • Provides macOS users with Homebrew installation instructions for the required Android platform tools.

📱 Phone MCP 플러그인

🌟 ADB 명령을 통해 Android 휴대폰을 손쉽게 제어할 수 있는 강력한 MCP 플러그인입니다.

중국어 문서

⚡ 빠른 시작

📥 설치

지엑스피1

🔧 구성

커서 설정

~/.cursor/mcp.json 에서 구성합니다.

{ "mcpServers": { "phone-mcp": { "command": "uvx", "args": [ "phone-mcp" ] } } }

클로드 셋업

Claude 구성에 추가:

{ "mcpServers": { "phone-mcp": { "command": "uvx", "args": [ "phone-mcp" ] } } }

용법:

  • 예를 들어, Claude 대화에서 명령을 직접 사용하세요.
    Please call contact hao

⚠️ 사용하기 전에 다음 사항을 확인하세요.

  • ADB가 제대로 설치 및 구성되었습니다.
  • Android 기기에서 USB 디버깅이 활성화되었습니다.
  • 장치가 USB를 통해 컴퓨터에 연결되었습니다.

🎯 주요 특징

  • 📞 통화 기능 : 전화 걸기, 전화 종료, 수신 전화 받기
  • 💬 메시징 : SMS를 보내고 받고, 원시 메시지를 받습니다.
  • 👥 연락처 : 휴대폰 연락처에 접근
  • 📸 미디어 : 스크린샷, 화면 녹화, 미디어 제어
  • 📱 : 앱 실행, 알람 설정, 설치된 앱 목록, 앱 종료
  • 🔧 시스템 : 창 정보, 앱 바로가기
  • 🗺️ 지도 : 전화번호로 POI 검색
  • 🖱️ UI 상호작용 : 탭, 스와이프, 텍스트 입력, 키 누르기
  • 🔍 UI 검사 : 텍스트, ID, 클래스 또는 설명으로 요소 찾기
  • 🤖 UI 자동화 : 요소 대기, 요소 찾기 위해 스크롤, UI 변경 사항 모니터링
  • 🧠 화면 분석 : 구조화된 화면 정보 및 통합된 상호작용
  • 🌐 웹 브라우저 : 기기의 기본 브라우저에서 URL을 엽니다.

🛠️ 요구 사항

  • 파이썬 3.7 이상
  • USB 디버깅이 활성화된 Android 기기
  • ADB 도구

📋 기본 명령

장치 및 연결

# Check device connection phone-cli check # Get screen size phone-cli screen-interact find method=clickable

의사소통

# Make a call phone-cli call 1234567890 # End current call phone-cli hangup # Send SMS phone-cli send-sms 1234567890 "Hello" # Check messages phone-cli messages --limit 10 # Get contacts phone-cli contacts --limit 20

미디어 및 앱

# Take screenshot phone-cli screenshot # Record screen phone-cli record --duration 30 # Launch app phone-cli app camera # Close app phone-cli close-app com.android.camera # List installed apps phone-cli list-apps --filter camera --third-party # Launch specific activity phone-cli launch com.android.settings/.Settings # Open URL in default browser phone-cli open-url google.com

화면 분석 및 상호작용

# Analyze current screen with structured information phone-cli analyze-screen # Unified interaction interface phone-cli screen-interact <action> [parameters] # Tap on element by text phone-cli screen-interact tap element_text="Login" # Tap at coordinates phone-cli screen-interact tap x=500 y=800 # Swipe gesture (scroll down) phone-cli screen-interact swipe x1=500 y1=1000 x2=500 y2=200 duration=300 # Press key phone-cli screen-interact key keycode=back # Input text phone-cli screen-interact text content="Hello World" # Find elements phone-cli screen-interact find method=text value="Login" partial=true # Wait for element phone-cli screen-interact wait method=text value="Success" timeout=10 # Scroll to find element phone-cli screen-interact scroll method=text value="Settings" direction=down max_swipes=5 # Monitor UI changes phone-cli monitor-ui --interval 1 --duration 60

위치 및 지도

# Search nearby POIs with phone numbers phone-cli get-poi 116.480053,39.987005 --keywords restaurant --radius 1000

📚 고급 사용법

화면 기반 자동화

통합된 화면 상호작용 인터페이스를 통해 지능형 에이전트는 다음을 쉽게 수행할 수 있습니다.

  1. 화면 분석 : UI 요소와 텍스트에 대한 구조화된 분석을 얻으세요
  2. 결정 내리기 : 감지된 UI 패턴과 사용 가능한 작업을 기반으로
  3. 상호작용 실행 : 일관된 매개변수 시스템을 통해
  4. 변경 사항 모니터링 : UI 변경 사항을 지속적으로 관찰하고 자동으로 대응합니다.

📚 문서

전체 문서와 구성 세부 정보를 보려면 GitHub 저장소를 방문하세요.

📄 라이센스

아파치 라이선스, 버전 2.0

-
security - not tested
A
license - permissive license
-
quality - not tested

AI 어시스턴트가 Android 휴대폰을 제어하고 자연어 명령을 통해 전화 걸기, 메시지 보내기, 스크린샷 찍기, 연락처에 접근하는 등의 기능을 사용할 수 있도록 하는 MCP용 플러그인입니다.

  1. ⚡ Quick Start
    1. 📥 Installation
    2. 🔧 Configuration
  2. 🎯 Key Features
    1. 🛠️ Requirements
      1. 📋 Basic Commands
        1. Device & Connection
        2. Communication
        3. Media & Apps
        4. Screen Analysis & Interaction
        5. Location & Maps
      2. 📚 Advanced Usage
        1. Screen-Driven Automation
      3. 📚 Documentation
        1. 📄 License
          ID: t1dxykaybp