Skip to main content
Glama

PyMCPAutoGUI

by kitfactory

PyMCPAutoGUI 🖱️⌨️🖼️ - MCP による GUI 自動化

AIエージェントの能力を強化! ✨ PyMCPAutoGUIは、AIエージェント(Cursorやその他のMCP互換環境のエージェントなど)とコンピューターのグラフィカルユーザーインターフェース(GUI)間の橋渡しを提供します。これにより、エージェントは人間のユーザーと同じように、画面👁️を表示し、マウス🖱️とキーボード⌨️を操作し、ウィンドウ🪟と対話できるようになります。

面倒なGUI手動タスクはもう終わりにして、AIに重労働を任せましょう💪。反復的なアクションの自動化、GUIのテスト、強力なAIアシスタントの構築に最適です🤖。

🤔 PyMCPAutoGUI を選ぶ理由は何ですか?

  • 🤖 エージェントを強化: AI エージェントにデスクトップ アプリケーションと直接対話する権限を与えます。
  • **✅ シンプルな統合:**カーソルエディターなどのMCP対応クライアントとシームレスに連携します。プラグアンドプレイですぐに使えます!
  • **🚀 使い方は簡単:**シンプルなサーバーコマンドですぐに始められます。本当に、こんなに簡単です。
  • **🖱️⌨️ 包括的なコントロール:**実績のあるPyAutoGUIPyGetWindowからの幅広い GUI 自動化機能を提供します。
  • **🖼️ 画面認識:**スクリーンショットを撮ったり、画面上の画像を見つけたりするためのツールが含まれています。エージェントに見せましょう!
  • **🪟 ウィンドウ管理:**ウィンドウの位置、サイズ、状態(最小化、最大化)などを制御します。デスクトップを整理整頓しましょう!
  • **💬 ユーザーインタラクション:**ユーザーとコミュニケーションをとるために、アラート、確認、プロンプトボックスを表示します。

🛠️ サポートされている環境

  • オペレーティング システム: Windows、macOS、Linux (各 OS でpyautoguiに適切な依存関係が必要です)
  • Python: 3.11+ 🐍
  • **MCP クライアント:**カーソル エディター、モデル コンテキスト プロトコル (MCP)をサポートする任意のクライアント

🚀 はじめに - とても簡単です!

1. インストール(推奨:仮想環境を使用!)

仮想環境を使用すると、プロジェクトの依存関係が整理されます。

# Create and activate a virtual environment (example using venv) python -m venv .venv # Windows PowerShell .venv\Scripts\Activate.ps1 # macOS / Linux bash source .venv/bin/activate # Install using pip (from PyPI or local source) # Make sure your virtual environment is active! pip install pymcpautogui # Or pip install . if installing from local source

(注: pyautoguiは、スクリーンショット用の Linux のscrotのようなシステム依存関係がある可能性があります。OS 固有のインストール要件については、 pyautoguiドキュメントを確認してください。)

2. MCPサーバーの実行

インストールが完了したら、ターミナルからサーバーを実行するだけです。

# Make sure your virtual environment is activated! python -m pymcpautogui.server

サーバーが起動し、接続を待機します(デフォルトはポート6789)。次の出力を確認してください。

INFO: Started server process [XXXXX] INFO: Waiting for application startup. INFO: Application startup complete. INFO: Uvicorn running on http://127.0.0.1:6789 (Press CTRL+C to quit)

GUI 自動化の魔法が必要な間は、このターミナルを実行したままにしておいてください! ✨

✨ カーソルエディターとのシームレスな統合

コーディング ワークフロー内で直接 GUI を自動化するには、PyMCPAutoGUI をカーソル (@ シンボル) に接続します。

  1. **MCP 構成を開く:**カーソルで、コマンド パレット ( Ctrl+Shift+PまたはCmd+Shift+P ) を使用して、「MCP: mcp.json 構成ファイルを開く」を見つけます。
  2. **PyMCPAutoGUI 設定を追加:**この設定をmcp.jsonに追加またはマージします。必要に応じてパスを調整してください(特に Cursor がプロジェクトルートから実行されていない場合)。
    { "mcpServers": { // ... other MCP server configs if any ... "PyMCPAutoGUI": { // Sets the working directory. ${workspaceFolder} is usually correct. "cwd": "${workspaceFolder}", // Command to run Python. 'python' works if the venv is active in the terminal // where Cursor was launched, or specify the full path. "command": "python", // Or ".venv/Scripts/python.exe" (Win) or ".venv/bin/python" (Mac/Linux) // Arguments to start the server module. "args": ["-m", "pymcpautogui.server"] } // ... other MCP server configs if any ... } }
    (ヒント: mcp.jsonがすでに存在する場合は、 mcpServersオブジェクト内に"PyMCPAutoGUI": { ... }部分を追加するだけです。)
  3. mcp.jsonを保存します。カーソルがサーバーを検出します。
  4. **自動化!**カーソルチャットで@PyMCPAutoGUIを使用します。例: @PyMCPAutoGUI move_to(x=100, y=200)``@PyMCPAutoGUI write(text='Automating with AI! 🎉', interval=0.1)``@PyMCPAutoGUI screenshot(filename='current_screen.png')``@PyMCPAutoGUI activate_window(title='Notepad')

🧰 利用可能なツール

PyMCPAutoGUI はpyautoguipygetwindowのほとんどの関数を公開します。例としては以下が挙げられます。

  • マウス 🖱️: move_toclickmove_reldrag_todrag_relscrollmouse_downmouse_upget_position
  • キーボード⌨️: writepresskey_downkey_uphotkey
  • スクリーンショット 🖼️: screenshotlocate_on_screenlocate_center_on_screen
  • ウィンドウ 🪟: get_all_titlesget_windows_with_titleget_active_windowactivate_windowminimize_windowmaximize_windowrestore_windowmove_windowresize_windowclose_window
  • ダイアログ💬: alertconfirmpromptpassword
  • 設定⚙️: set_pauseset_failsafe

完全なリストと詳細については、 pymcpautogui/server.pyファイルを確認するか、MCP クライアントで@PyMCPAutoGUI list_toolsを使用してください。

📄 ライセンス

このプロジェクトはMITライセンスに基づいています。詳細はLICENSEファイルをご覧ください。自動化を楽しみましょう!😄

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

AI エージェントと GUI 自動化機能を橋渡しする MCP サーバー。これにより、AI エージェントがマウス、キーボード、ウィンドウを制御し、スクリーンショットを撮ってデスクトップ アプリケーションと対話できるようになります。

  1. 🤔 PyMCPAutoGUI を選ぶ理由は何ですか?
    1. 🛠️ サポートされている環境
      1. 🚀 はじめに - とても簡単です!
        1. インストール(推奨:仮想環境を使用!)
        2. MCPサーバーの実行
      2. ✨ カーソルエディターとのシームレスな統合
        1. 🧰 利用可能なツール
          1. 📄 ライセンス

            Related MCP Servers

            • -
              security
              F
              license
              -
              quality
              An MCP server that allows AI assistants like Claude to execute terminal commands on the user's computer and return the output, functioning like a terminal through AI.
              Last updated -
              7
              Python
              • Apple
            • -
              security
              A
              license
              -
              quality
              An enhanced MCP server that grants AI assistants the ability to execute terminal commands on a user's system with improved security controls, designed for use in controlled environments.
              Last updated -
              Python
              MIT License
              • Apple
            • -
              security
              F
              license
              -
              quality
              A MCP server that allows AI assistants to interact with the browser, including getting page content as markdown, modifying page styles, and searching browser history.
              Last updated -
              5
              TypeScript
            • -
              security
              A
              license
              -
              quality
              MCP server that provides computer control capabilities including mouse movements, keyboard actions, screenshot capture with OCR, and window management through a unified API.
              Last updated -
              4
              Python
              MIT License

            View all related MCP servers

            MCP directory API

            We provide all the information about MCP servers via our MCP API.

            curl -X GET 'https://glama.ai/api/mcp/v1/servers/kitfactory/PyMCPAutoGUI'

            If you have feedback or need assistance with the MCP directory API, please join our Discord server