Integrations
Supports GUI automation on Linux operating systems, allowing agents to interact with Linux desktop environments through mouse and keyboard control.
Supports GUI automation on macOS, enabling agents to control mouse movements, keyboard input, and interact with macOS desktop applications.
Enables installation of the PyMCPAutoGUI package via pip from PyPI, making it easy to set up the GUI automation server.
PyMCPAutoGUI 🖱️⌨️🖼️ - MCP による GUI 自動化
AIエージェントの能力を強化! ✨ PyMCPAutoGUIは、AIエージェント(Cursorやその他のMCP互換環境のエージェントなど)とコンピューターのグラフィカルユーザーインターフェース(GUI)間の橋渡しを提供します。これにより、エージェントは人間のユーザーと同じように、画面👁️を表示し、マウス🖱️とキーボード⌨️を操作し、ウィンドウ🪟と対話できるようになります。
面倒なGUI手動タスクはもう終わりにして、AIに重労働を任せましょう💪。反復的なアクションの自動化、GUIのテスト、強力なAIアシスタントの構築に最適です🤖。
🤔 PyMCPAutoGUI を選ぶ理由は何ですか?
- 🤖 エージェントを強化: AI エージェントにデスクトップ アプリケーションと直接対話する権限を与えます。
- **✅ シンプルな統合:**カーソルエディターなどのMCP対応クライアントとシームレスに連携します。プラグアンドプレイですぐに使えます!
- **🚀 使い方は簡単:**シンプルなサーバーコマンドですぐに始められます。本当に、こんなに簡単です。
- **🖱️⌨️ 包括的なコントロール:**実績のあるPyAutoGUIとPyGetWindowからの幅広い GUI 自動化機能を提供します。
- **🖼️ 画面認識:**スクリーンショットを撮ったり、画面上の画像を見つけたりするためのツールが含まれています。エージェントに見せましょう!
- **🪟 ウィンドウ管理:**ウィンドウの位置、サイズ、状態(最小化、最大化)などを制御します。デスクトップを整理整頓しましょう!
- **💬 ユーザーインタラクション:**ユーザーとコミュニケーションをとるために、アラート、確認、プロンプトボックスを表示します。
🛠️ サポートされている環境
- オペレーティング システム: Windows、macOS、Linux (各 OS で
pyautogui
に適切な依存関係が必要です) - Python: 3.11+ 🐍
- **MCP クライアント:**カーソル エディター、モデル コンテキスト プロトコル (MCP)をサポートする任意のクライアント
🚀 はじめに - とても簡単です!
1. インストール(推奨:仮想環境を使用!)
仮想環境を使用すると、プロジェクトの依存関係が整理されます。
(注: pyautogui
は、スクリーンショット用の Linux のscrot
のようなシステム依存関係がある可能性があります。OS 固有のインストール要件については、 pyautogui
ドキュメントを確認してください。)
2. MCPサーバーの実行
インストールが完了したら、ターミナルからサーバーを実行するだけです。
サーバーが起動し、接続を待機します(デフォルトはポート6789)。次の出力を確認してください。
GUI 自動化の魔法が必要な間は、このターミナルを実行したままにしておいてください! ✨
✨ カーソルエディターとのシームレスな統合
コーディング ワークフロー内で直接 GUI を自動化するには、PyMCPAutoGUI をカーソル (@ シンボル) に接続します。
- **MCP 構成を開く:**カーソルで、コマンド パレット (
Ctrl+Shift+P
またはCmd+Shift+P
) を使用して、「MCP: mcp.json 構成ファイルを開く」を見つけます。 - **PyMCPAutoGUI 設定を追加:**この設定を
mcp.json
に追加またはマージします。必要に応じてパスを調整してください(特に Cursor がプロジェクトルートから実行されていない場合)。(ヒント:Copymcp.json
がすでに存在する場合は、mcpServers
オブジェクト内に"PyMCPAutoGUI": { ... }
部分を追加するだけです。) mcp.json
を保存します。カーソルがサーバーを検出します。- **自動化!**カーソルチャットで
@PyMCPAutoGUI
を使用します。例:@PyMCPAutoGUI move_to(x=100, y=200)``@PyMCPAutoGUI write(text='Automating with AI! 🎉', interval=0.1)``@PyMCPAutoGUI screenshot(filename='current_screen.png')``@PyMCPAutoGUI activate_window(title='Notepad')
🧰 利用可能なツール
PyMCPAutoGUI はpyautogui
とpygetwindow
のほとんどの関数を公開します。例としては以下が挙げられます。
- マウス 🖱️:
move_to
、click
、move_rel
、drag_to
、drag_rel
、scroll
、mouse_down
、mouse_up
、get_position
- キーボード⌨️:
write
、press
、key_down
、key_up
、hotkey
- スクリーンショット 🖼️:
screenshot
、locate_on_screen
、locate_center_on_screen
- ウィンドウ 🪟:
get_all_titles
、get_windows_with_title
、get_active_window
、activate_window
、minimize_window
、maximize_window
、restore_window
、move_window
、resize_window
、close_window
- ダイアログ💬:
alert
、confirm
、prompt
、password
- 設定⚙️:
set_pause
、set_failsafe
完全なリストと詳細については、 pymcpautogui/server.py
ファイルを確認するか、MCP クライアントで@PyMCPAutoGUI list_tools
を使用してください。
📄 ライセンス
このプロジェクトはMITライセンスに基づいています。詳細はLICENSEファイルをご覧ください。自動化を楽しみましょう!😄
This server cannot be installed
AI エージェントと GUI 自動化機能を橋渡しする MCP サーバー。これにより、AI エージェントがマウス、キーボード、ウィンドウを制御し、スクリーンショットを撮ってデスクトップ アプリケーションと対話できるようになります。