MCPコントロール
モデル コンテキスト プロトコル用の Windows コントロール サーバー。マウス、キーボード、ウィンドウ管理、画面キャプチャ機能などのシステム操作をプログラムで制御できます。
注意: このプロジェクトは現在 Windows のみをサポートしています。
🔥 なぜ MCPControl なのか?
MCPControl は、AI モデルとデスクトップ間のギャップを埋め、次のものを安全にプログラムで制御できるようにします。
- 🖱️マウスの動きとクリック
- ⌨️キーボード入力とショートカット
- 🪟ウィンドウ管理
- 📸スクリーンキャプチャと分析
- 📋クリップボード操作
🔌 クイックスタート
前提条件
- ビルドツールをインストールする(VC++ワークロードを含む)
- Python をインストールします(まだインストールされていない場合)
- Node.jsをインストールする
インストール
- MCPControl パッケージをインストールする
構成
MCPControl は、クリック精度を最適化するために、 1280x720 解像度の仮想マシンで最も効果的に機能します。
Claude クライアントを SSE トランスポート経由で MCPControl に接続するように構成します。
オプション1: 直接SSE接続
VM またはリモート マシン上で実行されている MCPControl サーバーに接続する場合:
192.168.1.100:3232
サーバーの IP アドレスとポートに置き換えます。
オプション2: SSEを使用したローカル起動
SSE トランスポートを使用して MCPControl をローカルで起動するには:
サーバーの起動
まず、VM またはローカル マシンで MCPControl サーバーを起動します。
サーバーには次のように表示されます:
- 利用可能なネットワークインターフェースとそのIPアドレス
- ポート番号(デフォルト: 3232)
- 接続ステータスメッセージ
VMセットアップ例
- 1280x720の解像度でWindows VMを起動する
- VM にMCPControl をインストールします。
- SSE トランスポートを使用してサーバーを実行します。
- VMのIPアドレスをメモします(例:
192.168.1.100
) - SSE URL を使用してClaude を構成します。
- Claude を再起動すると、MCP メニューに MCPControl が表示されます。
🔧 CLI オプション
MCPControl は、高度な構成のためにいくつかのコマンドライン フラグをサポートしています。
コマンドライン引数
--sse
- ネットワーク アクセス用の SSE (Server-Sent Events) トランスポートを有効にする--port [number]
- カスタムポートを指定します(デフォルト: 3232)--https
- HTTPS/TLS を有効にする (MCP 仕様に従ってリモート展開に必要)--cert [path]
- TLS証明書ファイルへのパス(--httpsの場合は必須)--key [path]
- TLS秘密鍵ファイルへのパス(--httpsの場合は必須)
セキュリティに関する注意事項
MCP仕様によると、本番環境におけるすべてのHTTPベースのトランスポートにはHTTPSが必須です。リモートアクセス用にMCPControlをデプロイする場合は、必ず有効なTLS証明書とともに--https
フラグを使用してください。
🚀 人気のユースケース
支援型自動化
- アプリケーションテスト: 反復的な UI テストを Claude に委任し、AI がアプリケーションをナビゲートして問題を報告できるようにします。
- ワークフロー自動化: クロードがあなたに代わってアプリケーションを操作し、反復的なタスクを処理するので、あなたはクリエイティブな仕事に集中できます。
- フォーム入力:クロードがあなたの監督下でデータ入力タスクを処理します
AI実験
- AIゲーム:クロードが視覚的なフィードバックを通じて簡単なゲームの遊び方を学ぶ様子をご覧ください
- 視覚的推論:クロードの視覚インターフェースを操作し、視覚的なパズルを解く能力をテストします
- 人間とAIのコラボレーション:クロードがあなたの画面を見て複雑なタスクを支援する新しいインタラクションパラダイムを探ります
開発とテスト
- アプリケーション間の統合: 通常は通信しないアプリケーションをブリッジします
- UIテストフレームワーク:視覚的な検証による堅牢なテストシナリオの作成
- デモ作成:製品デモの作成を自動化
⚠️ 重要な免責事項
このソフトウェアは実験的であり、潜在的に危険です
このソフトウェアを使用することにより、以下の事項を承認し、同意するものとします。
- このツールを通じてAIモデルにコンピューターを直接制御させることは本質的に危険である
- このソフトウェアはマウス、キーボード、その他のシステム機能を制御する可能性があり、予期しない結果を引き起こす可能性があります。
- このソフトウェアは完全に自己責任でご使用ください。
- このプロジェクトの作成者および貢献者は、このソフトウェアの使用によって生じる可能性のある損害、データ損失、またはその他の結果について一切責任を負いません。
- このツールは、適切な安全対策が講じられた管理された環境でのみ使用してください。
自己責任でご利用ください
🌟 特徴
🔧 自動化プロバイダー
MCPControl は、さまざまなユースケースに対応する複数の自動化プロバイダーをサポートしています。
- キーセンダー(デフォルト) - 高い信頼性を備えたネイティブWindowsオートメーション
- PowerShell - より簡単な操作のための Windows PowerShell ベースの自動化
- autohotkey - 高度な自動化ニーズに対応する AutoHotkey v2 スクリプト
プロバイダー構成
環境変数を使用して自動化プロバイダーを構成できます。
または、特定の操作にモジュール構成を使用します。
プロバイダー固有のドキュメントを参照してください:
🛠️ 開発セットアップ
貢献またはソースからのビルドに興味がある場合は、詳細な手順についてはCONTRIBUTING.md を参照してください。
開発要件
このプロジェクトを開発用にビルドするには、次のものが必要です。
- Windows オペレーティング システム (キー送信者の依存関係に必要)
- Node.js 18 以降 (ビルド ツールを含む公式 Windows インストーラーを使用してインストールします)
- npm パッケージマネージャー
- ネイティブ ビルド ツール:
- node-gyp:
npm install -g node-gyp
- cmake-js:
npm install -g cmake-js
- node-gyp:
キーセンダーの依存関係は、これらのビルド ツールを必要とする Windows 固有のネイティブ モジュールに依存します。
📋 プロジェクト構造
/src
/handlers
- リクエストハンドラーとツール管理/tools
- コア機能の実装/types
- TypeScript 型定義index.ts
- メインアプリケーションのエントリポイント
🔖 リポジトリブランチ
main
- 最新の機能と変更を含むメイン開発ブランチrelease
- 最新の安定タグをミラーリングした安定リリースブランチ (現在 v0.2.0)
バージョンのインストール
npm を使用して MCPControl の特定のバージョンをインストールできます。
📚 依存関係
- @modelcontextprotocol/sdk - プロトコル実装用の MCP SDK
- キーセンダー- Windows 専用の UI 自動化ライブラリ
- clipboardy - クリップボードの処理
- シャープ- 画像処理
- uuid - UUID生成
🚧 既知の制限事項
- ウィンドウの最小化/復元操作は現在サポートされていません
- 設定によっては、複数の画面機能が期待どおりに動作しない場合があります。
- get_screenshotユーティリティはVS Code拡張機能Clineでは動作しません。GitHubのissue #1865をご覧ください。
- 一部の操作では、対象アプリケーションに応じて昇格された権限が必要になる場合があります。
- Windowsのみサポートされています
- MCPControlは1280x720の解像度、シングルスクリーンで最適に動作します。クリック精度はこの解像度で最適化されています。現在、オフセット/スケーリングのバグ修正に取り組んでおり、テスターまたはテストツール作成の協力者を募集しています。
👥 貢献する
⚖️ ライセンス
このプロジェクトは MIT ライセンスに基づいてライセンスされています - 詳細については LICENSE ファイルを参照してください。
📖 参考文献
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
モデル コンテキスト プロトコル用の Windows コントロール サーバー。マウス、キーボード、ウィンドウ管理、画面キャプチャ機能などのシステム操作をプログラムで制御できます。
Related MCP Servers
- AsecurityAlicenseAqualityA Model Context Protocol server that provides programmatic access to the Windows terminal, enabling AI models to interact with the Windows command line through standardized tools for writing commands, reading output, and sending control signals.Last updated -3JavaScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that provides secure command-line access to Windows systems, allowing MCP clients like Claude Desktop to safely execute commands in PowerShell, CMD, and Git Bash shells with configurable security controls.Last updated -9350105JavaScriptMIT License
- -securityAlicense-qualityA Model Context Protocol server that wraps AutoIt functionality, enabling LLMs to automate Windows desktop tasks including mouse/keyboard operations, window management, and UI control interactions.Last updated -TypeScriptMIT License
- AsecurityAlicenseAqualityA secure Model Context Protocol server that allows AI models to safely interact with Windows command-line functionality, enabling controlled execution of system commands, project creation, and system information retrieval.Last updated -83TypeScriptMIT License