MCP Windowsデスクトップオートメーション
AutoIt を使用した Windows デスクトップ自動化用のモデル コンテキスト プロトコル (MCP) サーバー。
概要
このプロジェクトは、node-autoit-koffiパッケージをラップする TypeScript MCP サーバーを提供し、LLM アプリケーションが MCP プロトコルを通じて Windows デスクトップ タスクを自動化できるようにします。
サーバーは以下を公開します:
- ツール: すべてのAutoIt機能はMCPツールとして機能します
- リソース: ファイルアクセスとスクリーンショット機能
- プロンプト: 一般的な自動化タスクのテンプレート
特徴
- すべてのAutoIt機能をMCPツールとして完全にラップ
- stdioとWebSocketトランスポートの両方をサポート
- ファイルとディレクトリを読み取るためのファイルアクセスリソース
- 画面または特定のウィンドウをキャプチャするためのスクリーンショットリソース
- 一般的な自動化タスクのプロンプトテンプレート
- 厳格なTypeScript型付け
インストール
# Clone the repository
git clone https://github.com/yourusername/mcp-windows-desktop-automation.git
cd mcp-windows-desktop-automation
# Install dependencies
npm install
# Build the project
npm run build
使用法
サーバーの起動
# Start with stdio transport (default)
npm start
# Start with WebSocket transport
npm start -- --transport=websocket --port=3000
# Enable verbose logging
npm start -- --verbose
コマンドラインオプション
--transport=stdio|websocket
: トランスポートプロトコルを指定します(デフォルト: stdio)--port=<number>
: WebSocketトランスポートのポート番号を指定します(デフォルト: 3000)--verbose
: 詳細ログを有効にする
ツール
サーバーは次のツールを提供します:
- マウス操作:移動、クリック、ドラッグなど
- キーボード操作:キーストローク、クリップボード操作などを送信します。
- ウィンドウ管理: ウィンドウの検索、アクティブ化、閉じる、サイズ変更など。
- コントロール操作: UI コントロール、ボタン、テキスト フィールドなどを操作します。
- プロセス管理: プロセスの開始、停止、監視
- システム操作:シャットダウン、スリープなど
リソース
サーバーは次のリソースを提供します:
- ファイルアクセス: ファイルの読み取りとディレクトリの一覧表示
- スクリーンショット: 画面または特定のウィンドウをキャプチャします
プロンプト
サーバーは、次のプロンプト テンプレートを提供します。
- ウィンドウの操作: ウィンドウを見つけて操作する
- フォーム入力: フォーム入力タスクを自動化
- 自動化タスク: 繰り返しタスクのスクリプトを作成する
- 監視:特定の条件を待つ
発達
# Run in development mode
npm run dev
# Lint the code
npm run lint
# Run tests
npm run test
ライセンス
マサチューセッツ工科大学