Windows-MCP

MIT License

Windows MCPは、 AIエージェントとWindowsオペレーティングシステムのシームレスな統合を可能にする軽量のオープンソースプロジェクトです。MCPサーバーとして機能することで、LLMとWindowsオペレーティングシステム間のギャップを埋め、エージェントがファイルナビゲーション、アプリケーション制御、UIインタラクション、QAテストなどのタスクを実行できるようになります。

https://github.com/user-attachments/assets/45976f41-7dac-47f3-93a2-2b867feb9433

✨ 主な特徴

  • シームレスなWindows統合
    Windows UI 要素とネイティブに対話し、アプリを開いたり、ウィンドウを制御したり、ユーザー入力をシミュレートしたりします。
  • **任意の LLM を使用 (ビジョンはオプション)**多くの自動化ツールとは異なり、Windows MCP は従来のコンピューター ビジョン技術や特定の微調整されたモデルに依存せず、任意の LLM で動作するため、複雑さが軽減され、セットアップ時間が短縮されます。
  • UI自動化のための豊富なツールセット
    基本的なキーボード、マウス操作、ウィンドウ/UI 状態のキャプチャ用のツールが含まれています。
  • 軽量でオープンソース
    依存関係が最小限でセットアップが簡単で、完全なソース コードが MIT ライセンスの下で利用可能です。
  • カスタマイズ可能&拡張可能
    独自の自動化または AI 統合のニーズに合わせてツールを簡単に調整または拡張できます。
  • リアルタイムインタラクション
    アクション間の一般的な遅延(マウスのクリックから次のクリックまでなど)は4 ~ 8 秒の範囲で、アクティブなアプリケーションの数やシステム負荷によって若干異なる場合があります。

サポートされているオペレーティングシステム

  • ウィンドウズ10
  • ウィンドウズ11

インストール

前提条件

  • Python 3.12以上
  • Anthropic Claude デスクトップ アプリまたはその他の MCP クライアント
  • UV (Python パッケージ マネージャー)、 pip install uvでインストールします。

🏁 はじめに

  1. リポジトリをクローンします。
git clone https://github.com/Computer-Agent/Windows-MCP.git cd Windows-MCP
  1. 依存関係をインストールします:
uv pip install -r pyproject.toml
  1. MCPサーバーに接続する

適切な {{PATH}} 値を含む以下の JSON をコピーします。

{ "mcpServers": { "windows-mcp": { "command": "{{PATH_TO_UV}}", "args": [ "--directory", "{{PATH_TO_SRC}}/Windows-MCP", "run", "server.py" ] } } }

Claude の場合、これを claude_desktop_config.json として次の Claude Desktop 構成ディレクトリに保存します。

%APPDATA%/Claude/claude_desktop_config.json
  1. Claudeデスクトップを再起動します

Claude Desktop を開くと、利用可能な統合として Windows-MCP が表示されます。

Claude Desktop統合のトラブルシューティングの詳細については、 MCPドキュメントをご覧ください。このドキュメントには、ログの確認や一般的な問題の解決に役立つヒントが記載されています。


🛠️MCP ツール

クロードは、Windows と対話するために次のツールにアクセスできます。

  • Click-Tool : 指定された座標で画面をクリックします。
  • Type-Tool : 要素にテキストを入力します (オプションで既存のテキストをクリアします)。
  • Clipboard-Tool : システム クリップボードを使用してコピーまたは貼り付けます。
  • Scroll-Tool : 上下にスクロールします。
  • Drag-Tool : ある点から別の点へドラッグします。
  • Move-Tool : マウス ポインターを移動します。
  • Shortcut-Tool : キーボード ショートカット ( Ctrl+cAlt+Tabなど) を押します。
  • Key-Tool : キーを 1 つ押します。
  • Wait-Tool : 定義された期間、一時停止します。
  • State-Tool : アクティブなアプリとインタラクティブな UI 要素を組み合わせたスナップショット。
  • Screenshot-Tool : デスクトップのスクリーンショットをキャプチャします。
  • Launch-Tool : スタート メニューからアプリケーションを起動します。
  • Shell-Tool : PowerShell コマンドを実行します。

⚠️注意

このMCPはWindowsオペレーティングシステムと直接連携してアクションを実行します。注意して使用し、このようなリスクを許容できない環境への導入は避けてください。

🪪ライセンス

このプロジェクトは MIT ライセンスに基づいてライセンスされています - 詳細についてはLICENSEファイルを参照してください。

🤝貢献する

貢献を歓迎します!セットアップ手順と開発ガイドラインについては、 「貢献」を参照してください。

Jeomon Georgeが❤️で作りました

-
security - not tested
A
license - permissive license
-
quality - not tested

AI エージェントが Windows オペレーティング システムと対話できるようにし、さまざまなツールによるファイル ナビゲーション、アプリケーション制御、UI 対話、QA テストを可能にする軽量サーバーです。

  1. サポートされているオペレーティングシステム
    1. インストール
      1. 前提条件
    2. 🏁 はじめに
      1. 🛠️MCP ツール
        1. ⚠️注意
          1. 🪪ライセンス
            1. 🤝貢献する

              Related MCP Servers

              • A
                security
                A
                license
                A
                quality
                A Model Context Protocol server that enables AI clients to interact with virtual Ubuntu desktops, allowing them to browse the web, run code, and control instances through mouse/keyboard actions and bash commands.
                Last updated -
                5
                9
                JavaScript
                MIT License
              • -
                security
                A
                license
                -
                quality
                A Model Context Protocol server that enables AI agents to interact with ClickUp workspaces, allowing task creation, management, and workspace organization through natural language commands.
                Last updated -
                376
                MIT License
              • -
                security
                F
                license
                -
                quality
                A server that enables AI systems to browse, retrieve content from, and interact with web pages through the Model Context Protocol.
                Last updated -
              • -
                security
                F
                license
                -
                quality
                A lightweight server that enables AI assistants like Cursor & Claude to read from and write to Obsidian vaults, allowing actions like creating notes, checking existing content, and managing todos through natural language.
                Last updated -
                192
                8
                TypeScript

              View all related MCP servers

              ID: g8lizqmcdh