Skip to main content
Glama

Windows-MCP

by CursorTouch

Windows MCPは、 AIエージェントとWindowsオペレーティングシステムのシームレスな統合を可能にする軽量のオープンソースプロジェクトです。MCPサーバーとして機能することで、LLMとWindowsオペレーティングシステム間のギャップを埋め、エージェントがファイルナビゲーション、アプリケーション制御、UIインタラクション、QAテストなどのタスクを実行できるようになります。

https://github.com/user-attachments/assets/d0e7ed1d-6189-4de6-838a-5ef8e1cad54e

✨ 主な特徴

  • シームレスなWindows統合
    Windows UI 要素とネイティブに対話し、アプリを開いたり、ウィンドウを制御したり、ユーザー入力をシミュレートしたりします。
  • **任意の LLM を使用 (ビジョンはオプション)**多くの自動化ツールとは異なり、Windows MCP は従来のコンピューター ビジョン技術や特定の微調整されたモデルに依存せず、任意の LLM で動作するため、複雑さが軽減され、セットアップ時間が短縮されます。
  • UI自動化のための豊富なツールセット
    基本的なキーボード、マウス操作、ウィンドウ/UI 状態のキャプチャ用のツールが含まれています。
  • 軽量でオープンソース
    依存関係が最小限でセットアップが簡単で、完全なソース コードが MIT ライセンスの下で利用可能です。
  • カスタマイズ可能&拡張可能
    独自の自動化または AI 統合のニーズに合わせてツールを簡単に調整または拡張できます。
  • リアルタイムインタラクション
    アクション間の一般的な遅延(マウスのクリックから次のクリックまでなど)は4 ~ 8 秒の範囲で、アクティブなアプリケーションの数やシステム負荷によって若干異なる場合があります。

サポートされているオペレーティングシステム

  • ウィンドウズ10
  • ウィンドウズ11

インストール

前提条件

  • Python 3.12以上
  • Anthropic Claude デスクトップ アプリまたはその他の MCP クライアント
  • UV (Python パッケージ マネージャー)、 pip install uvでインストールします。

🏁 はじめに

  1. リポジトリをクローンします。
git clone https://github.com/CursorTouch/Windows-MCP.git cd Windows-MCP
  1. 依存関係をインストールします:
uv pip install -r pyproject.toml
  1. MCPサーバーに接続する

適切な {{PATH}} 値を含む以下の JSON をコピーします。

{ "mcpServers": { "windows-mcp": { "command": "{{PATH_TO_UV}}", "args": [ "--directory", "{{PATH_TO_SRC}}/Windows-MCP", "run", "server.py" ] } } }

Claude の場合、これを claude_desktop_config.json として次の Claude Desktop 構成ディレクトリに保存します。

%APPDATA%/Claude/claude_desktop_config.json
  1. Claudeデスクトップを再起動します

Claude Desktop を開くと、利用可能な統合として Windows-MCP が表示されます。

Claude Desktop統合のトラブルシューティングの詳細については、 MCPドキュメントをご覧ください。このドキュメントには、ログの確認や一般的な問題の解決に役立つヒントが記載されています。


🛠️MCPツール

クロードは、Windows と対話するために次のツールにアクセスできます。

  • Click-Tool : 指定された座標で画面をクリックします。
  • Type-Tool : 要素にテキストを入力します (オプションで既存のテキストをクリアします)。
  • Clipboard-Tool : システム クリップボードを使用してコピーまたは貼り付けます。
  • Scroll-Tool : 上/下にスクロールします。
  • Drag-Tool : ある点から別の点へドラッグします。
  • Move-Tool : マウス ポインターを移動します。
  • Shortcut-Tool : キーボード ショートカット ( Ctrl+cAlt+Tabなど) を押します。
  • Key-Tool : キーを 1 つ押します。
  • Wait-Tool : 定義された期間、一時停止します。
  • State-Tool : アクティブなアプリとインタラクティブな UI 要素を組み合わせたスナップショット。
  • Screenshot-Tool : デスクトップのスクリーンショットをキャプチャします。
  • Launch-Tool : スタート メニューからアプリケーションを起動します。
  • Shell-Tool : PowerShell コマンドを実行します。

⚠️注意

このMCPはWindowsオペレーティングシステムと直接連携してアクションを実行します。注意して使用し、このようなリスクを許容できない環境への導入は避けてください。

🪪ライセンス

このプロジェクトは MIT ライセンスに基づいてライセンスされています - 詳細についてはLICENSEファイルを参照してください。

🤝貢献する

貢献を歓迎します!セットアップ手順と開発ガイドラインについては、 「貢献」を参照してください。

Jeomon Georgeが❤️で作りました

引用

@misc{ author = {George, Jeomon}, title = {Windows-MCP}, year = {2024}, publisher = {GitHub}, howpublished = {\url{https://github.com/Jeomon/Windows-MCP}}, note = {Lightweight open-source project for integrating LLM agents with Windows} }
-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

AI エージェントが Windows オペレーティング システムと対話できるようにし、さまざまなツールによるファイル ナビゲーション、アプリケーション制御、UI 対話、QA テストを可能にする軽量サーバーです。

  1. サポートされているオペレーティングシステム
    1. インストール
      1. 前提条件
    2. 🏁 はじめに
      1. 🛠️MCPツール
        1. ⚠️注意
          1. 🪪ライセンス
            1. 🤝貢献する
              1. 引用

                Related MCP Servers

                • -
                  security
                  F
                  license
                  -
                  quality
                  A powerful server that enables AI agents to interact with MySQL databases, execute SQL queries, and manage database content through a simple interface.
                  Last updated -
                  25
                  4
                  JavaScript
                  • Apple
                • -
                  security
                  A
                  license
                  -
                  quality
                  An MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.
                  Last updated -
                  Python
                  MIT License
                  • Apple
                  • Linux
                • -
                  security
                  -
                  license
                  -
                  quality
                  A command-line interface server that provides unrestricted system access to Windows environments with SYSTEM-level privileges, allowing complete control over files, processes, and configuration settings.
                  Last updated -
                  TypeScript
                  MIT License
                • -
                  security
                  F
                  license
                  -
                  quality
                  A server that allows AI models to automate Microsoft Office applications (Word, Excel, PowerPoint, etc.) through COM interface on Windows, enabling natural language control of Office functions.
                  Last updated -
                  7
                  Python

                View all related MCP servers

                MCP directory API

                We provide all the information about MCP servers via our MCP API.

                curl -X GET 'https://glama.ai/api/mcp/v1/servers/CursorTouch/Windows-MCP'

                If you have feedback or need assistance with the MCP directory API, please join our Discord server