Skip to main content
Glama

MCPコントロール

モデル コンテキスト プロトコル用の Windows コントロール サーバー。マウス、キーボード、ウィンドウ管理、画面キャプチャ機能などのシステム操作をプログラムで制御できます。

注意: このプロジェクトは現在 Windows のみをサポートしています。

🔥 なぜ MCPControl なのか?

MCPControl は、AI モデルとデスクトップ間のギャップを埋め、次のものを安全にプログラムで制御できるようにします。

  • 🖱️マウスの動きとクリック
  • ⌨️キーボード入力とショートカット
  • 🪟ウィンドウ管理
  • 📸スクリーンキャプチャと分析
  • 📋クリップボード操作

🔌 クイックスタート

前提条件

  1. ビルドツールをインストールする(VC++ワークロードを含む)
    # Run as Administrator - may take a few minutes to complete winget install Microsoft.VisualStudio.2022.BuildTools --override "--wait --passive --add Microsoft.VisualStudio.Workload.VCTools --includeRecommended"
  2. Python をインストールします(まだインストールされていない場合)
    # Install Python (required for node-gyp) winget install Python.Python.3.12
  3. Node.jsをインストールする
    # Install latest LTS version winget install OpenJS.NodeJS

インストール

  1. MCPControl パッケージをインストールする
    npm install -g mcp-control

構成

MCPControl は、クリック精度を最適化するために、 1280x720 解像度の仮想マシンで最も効果的に機能します。

Claude クライアントを SSE トランスポート経由で MCPControl に接続するように構成します。

オプション1: 直接SSE接続

VM またはリモート マシン上で実行されている MCPControl サーバーに接続する場合:

{ "mcpServers": { "MCPControl": { "transport": "sse", "url": "http://192.168.1.100:3232/mcp" } } }

192.168.1.100:3232サーバーの IP アドレスとポートに置き換えます。

オプション2: SSEを使用したローカル起動

SSE トランスポートを使用して MCPControl をローカルで起動するには:

{ "mcpServers": { "MCPControl": { "command": "mcp-control", "args": ["--sse"] } } }

サーバーの起動

まず、VM またはローカル マシンで MCPControl サーバーを起動します。

mcp-control --sse

サーバーには次のように表示されます:

  • 利用可能なネットワークインターフェースとそのIPアドレス
  • ポート番号(デフォルト: 3232)
  • 接続ステータスメッセージ

VMセットアップ例

  1. 1280x720の解像度でWindows VMを起動する
  2. VM にMCPControl をインストールします
    npm install -g mcp-control
  3. SSE トランスポートを使用してサーバーを実行します
    mcp-control --sse
  4. VMのIPアドレスをメモします(例: 192.168.1.100
  5. SSE URL を使用してClaude を構成します
    { "mcpServers": { "MCPControl": { "transport": "sse", "url": "http://192.168.1.100:3232/mcp" } } }
  6. Claude を再起動すると、MCP メニューに MCPControl が表示されます。

🔧 CLI オプション

MCPControl は、高度な構成のためにいくつかのコマンドライン フラグをサポートしています。

# Run with SSE transport on default port (3232) mcp-control --sse # Run with SSE on custom port mcp-control --sse --port 3000 # Run with HTTPS/TLS (required for production deployments) mcp-control --sse --https --cert /path/to/cert.pem --key /path/to/key.pem # Run with HTTPS on custom port mcp-control --sse --https --port 8443 --cert /path/to/cert.pem --key /path/to/key.pem

コマンドライン引数

  • --sse - ネットワーク アクセス用の SSE (Server-Sent Events) トランスポートを有効にする
  • --port [number] - カスタムポートを指定します(デフォルト: 3232)
  • --https - HTTPS/TLS を有効にする (MCP 仕様に従ってリモート展開に必要)
  • --cert [path] - TLS証明書ファイルへのパス(--httpsの場合は必須)
  • --key [path] - TLS秘密鍵ファイルへのパス(--httpsの場合は必須)

セキュリティに関する注意事項

MCP仕様によると、本番環境におけるすべてのHTTPベースのトランスポートにはHTTPSが必須です。リモートアクセス用にMCPControlをデプロイする場合は、必ず有効なTLS証明書とともに--httpsフラグを使用してください。

🚀 人気のユースケース

支援型自動化

  • アプリケーションテスト: 反復的な UI テストを Claude に委任し、AI がアプリケーションをナビゲートして問題を報告できるようにします。
  • ワークフロー自動化: クロードがあなたに代わってアプリケーションを操作し、反復的なタスクを処理するので、あなたはクリエイティブな仕事に集中できます。
  • フォーム入力:クロードがあなたの監督下でデータ入力タスクを処理します

AI実験

  • AIゲーム:クロードが視覚的なフィードバックを通じて簡単なゲームの遊び方を学ぶ様子をご覧ください
  • 視覚的推論:クロードの視覚インターフェースを操作し、視覚的なパズルを解く能力をテストします
  • 人間とAIのコラボレーション:クロードがあなたの画面を見て複雑なタスクを支援する新しいインタラクションパラダイムを探ります

開発とテスト

  • アプリケーション間の統合: 通常は通信しないアプリケーションをブリッジします
  • UIテストフレームワーク:視覚的な検証による堅牢なテストシナリオの作成
  • デモ作成:製品デモの作成を自動化

⚠️ 重要な免責事項

このソフトウェアは実験的であり、潜在的に危険です

このソフトウェアを使用することにより、以下の事項を承認し、同意するものとします。

  • このツールを通じてAIモデルにコンピューターを直接制御させることは本質的に危険である
  • このソフトウェアはマウス、キーボード、その他のシステム機能を制御する可能性があり、予期しない結果を引き起こす可能性があります。
  • このソフトウェアは完全に自己責任でご使用ください。
  • このプロジェクトの作成者および貢献者は、このソフトウェアの使用によって生じる可能性のある損害、データ損失、またはその他の結果について一切責任を負いません。
  • このツールは、適切な安全対策が講じられた管理された環境でのみ使用してください。

自己責任でご利用ください

🌟 特徴

🔧 自動化プロバイダー

MCPControl は、さまざまなユースケースに対応する複数の自動化プロバイダーをサポートしています。

  • キーセンダー(デフォルト) - 高い信頼性を備えたネイティブWindowsオートメーション
  • PowerShell - より簡単な操作のための Windows PowerShell ベースの自動化
  • autohotkey - 高度な自動化ニーズに対応する AutoHotkey v2 スクリプト

プロバイダー構成

環境変数を使用して自動化プロバイダーを構成できます。

# Use a specific provider for all operations export AUTOMATION_PROVIDER=autohotkey # Configure AutoHotkey executable path (if not in PATH) export AUTOHOTKEY_PATH="C:\Program Files\AutoHotkey\v2\AutoHotkey.exe"

または、特定の操作にモジュール構成を使用します。

# Mix and match providers for different operations export AUTOMATION_KEYBOARD_PROVIDER=autohotkey export AUTOMATION_MOUSE_PROVIDER=keysender export AUTOMATION_SCREEN_PROVIDER=keysender export AUTOMATION_CLIPBOARD_PROVIDER=powershell

プロバイダー固有のドキュメントを参照してください:

🛠️ 開発セットアップ

貢献またはソースからのビルドに興味がある場合は、詳細な手順についてはCONTRIBUTING.md を参照してください。

開発要件

このプロジェクトを開発用にビルドするには、次のものが必要です。

  1. Windows オペレーティング システム (キー送信者の依存関係に必要)
  2. Node.js 18 以降 (ビルド ツールを含む公式 Windows インストーラーを使用してインストールします)
  3. npm パッケージマネージャー
  4. ネイティブ ビルド ツール:
    • node-gyp: npm install -g node-gyp
    • cmake-js: npm install -g cmake-js

キーセンダーの依存関係は、これらのビルド ツールを必要とする Windows 固有のネイティブ モジュールに依存します。

📋 プロジェクト構造

  • /src
    • /handlers - リクエストハンドラーとツール管理
    • /tools - コア機能の実装
    • /types - TypeScript 型定義
    • index.ts - メインアプリケーションのエントリポイント

🔖 リポジトリブランチ

  • main - 最新の機能と変更を含むメイン開発ブランチ
  • release - 最新の安定タグをミラーリングした安定リリースブランチ (現在 v0.2.0)

バージョンのインストール

npm を使用して MCPControl の特定のバージョンをインストールできます。

# Install the latest stable release (from release branch) npm install mcp-control # Install a specific version npm install mcp-control@0.1.22

📚 依存関係

🚧 既知の制限事項

  • ウィンドウの最小化/復元操作は現在サポートされていません
  • 設定によっては、複数の画面機能が期待どおりに動作しない場合があります。
  • get_screenshotユーティリティはVS Code拡張機能Clineでは動作しません。GitHubのissue #1865をご覧ください。
  • 一部の操作では、対象アプリケーションに応じて昇格された権限が必要になる場合があります。
  • Windowsのみサポートされています
  • MCPControlは1280x720の解像度、シングルスクリーンで最適に動作します。クリック精度はこの解像度で最適化されています。現在、オフセット/スケーリングのバグ修正に取り組んでおり、テスターまたはテストツール作成の協力者を募集しています。

👥 貢献する

CONTRIBUTING.mdを参照

⚖️ ライセンス

このプロジェクトは MIT ライセンスに基づいてライセンスされています - 詳細については LICENSE ファイルを参照してください。

📖 参考文献

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

モデル コンテキスト プロトコル用の Windows コントロール サーバー。マウス、キーボード、ウィンドウ管理、画面キャプチャ機能などのシステム操作をプログラムで制御できます。

  1. 🔥 なぜ MCPControl なのか?
    1. 🔌 クイックスタート
      1. 前提条件
      2. インストール
      3. 構成
      4. サーバーの起動
      5. VMセットアップ例
    2. 🔧 CLI オプション
      1. コマンドライン引数
      2. セキュリティに関する注意事項
    3. 🚀 人気のユースケース
      1. 支援型自動化
      2. AI実験
      3. 開発とテスト
    4. ⚠️ 重要な免責事項
      1. 🌟 特徴
        1. 🔧 自動化プロバイダー
          1. プロバイダー構成
        2. 🛠️ 開発セットアップ
          1. 開発要件
        3. 📋 プロジェクト構造
          1. 🔖 リポジトリブランチ
            1. バージョンのインストール
          2. 📚 依存関係
            1. 🚧 既知の制限事項
              1. 👥 貢献する
                1. ⚖️ ライセンス
                  1. 📖 参考文献

                    Related MCP Servers

                    • A
                      security
                      A
                      license
                      A
                      quality
                      A beginner-friendly Model Context Protocol (MCP) server that helps users understand MCP concepts, provides interactive examples, and lists available MCP servers. This server is designed to be a helpful companion for developers working with MCP. Also comes with a huge list of servers you can install.
                      Last updated -
                      3
                      9
                      36
                      JavaScript
                      Apache 2.0
                    • A
                      security
                      A
                      license
                      A
                      quality
                      A Model Context Protocol server that provides secure command-line access to Windows systems, allowing MCP clients like Claude Desktop to safely execute commands in PowerShell, CMD, and Git Bash shells with configurable security controls.
                      Last updated -
                      9
                      350
                      105
                      JavaScript
                      MIT License
                    • -
                      security
                      -
                      license
                      -
                      quality
                      A Model Context Protocol (MCP) server that interacts with system APIs, allowing users to check connections, search employees, register breakfast, and update chemical information by shifts.
                      Last updated -
                      2
                    • -
                      security
                      A
                      license
                      -
                      quality
                      Provides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.
                      Last updated -
                      6
                      Python
                      MIT License
                      • Apple
                      • Linux

                    View all related MCP servers

                    MCP directory API

                    We provide all the information about MCP servers via our MCP API.

                    curl -X GET 'https://glama.ai/api/mcp/v1/servers/intelligence-assist/MCPControl'

                    If you have feedback or need assistance with the MCP directory API, please join our Discord server