Skip to main content
Glama

Windows-MCP

by CursorTouch

Windows MCP是一个轻量级的开源项目,它支持 AI 代理与 Windows 操作系统之间的无缝集成。作为 MCP 服务器,它可以弥合 LLM 与 Windows 操作系统之间的差距,使代理能够执行文件导航、应用程序控制、UI 交互、QA 测试等任务。

https://github.com/user-attachments/assets/d0e7ed1d-6189-4de6-838a-5ef8e1cad54e

✨ 主要特点

  • 无缝 Windows 集成
    与 Windows UI 元素进行本机交互、打开应用程序、控制窗口、模拟用户输入等。
  • **使用任何 LLM(视觉可选)**与许多自动化工具不同,Windows MCP 不依赖任何传统的计算机视觉技术或特定的微调模型;它适用于任何 LLM,从而降低了复杂性和设置时间。
  • 丰富的 UI 自动化工具集
    包括用于基本键盘、鼠标操作和捕获窗口/UI 状态的工具。
  • 轻量级和开源
    依赖性最小,设置简单,完整源代码可在 MIT 许可下获得。
  • 可定制且可扩展
    轻松调整或扩展工具以满足您独特的自动化或 AI 集成需求。
  • 实时互动
    操作之间的典型延迟(例如,从一次鼠标单击到下一次鼠标单击)范围为4 到 8 秒,并且可能根据活动应用程序的数量和系统负载而略有不同。

支持的操作系统

  • Windows 10
  • Windows 11

安装

先决条件

  • Python 3.12+
  • Anthropic Claude 桌面应用程序或其他 MCP 客户端
  • UV(Python 包管理器),使用pip install uv安装

🏁 入门

  1. 克隆存储库。
git clone https://github.com/CursorTouch/Windows-MCP.git cd Windows-MCP
  1. 安装依赖项:
uv pip install -r pyproject.toml
  1. 连接到 MCP 服务器

使用适当的 {{PATH}} 值复制以下 JSON:

{ "mcpServers": { "windows-mcp": { "command": "{{PATH_TO_UV}}", "args": [ "--directory", "{{PATH_TO_SRC}}/Windows-MCP", "run", "server.py" ] } } }

对于 Claude,将其保存为 claude_desktop_config.json,保存在 Claude Desktop 配置目录中:

%APPDATA%/Claude/claude_desktop_config.json
  1. 重启Claude桌面

打开 Claude Desktop,您现在应该看到 Windows-MCP 作为可用的集成。

有关 Claude Desktop 集成故障排除的更多内容,请参阅MCP 文档。该文档包含检查日志和解决常见问题的实用技巧。


🛠️MCP 工具

Claude 可以访问以下工具与 Windows 进行交互:

  • Click-Tool :在给定的坐标处点击屏幕。
  • Type-Tool :在元素上输入文本(可选择清除现有文本)。
  • Clipboard-Tool :使用系统剪贴板复制或粘贴。
  • Scroll-Tool :向上/向下滚动。
  • Drag-Tool :从一个点拖动到另一个点。
  • Move-Tool :移动鼠标指针。
  • Shortcut-Tool :按键盘快捷键( Ctrl+cAlt+Tab等)。
  • Key-Tool :按下一个键。
  • Wait-Tool :暂停一段定义的时间。
  • State-Tool :活动应用程序和交互式 UI 元素的组合快照。
  • Screenshot-Tool :捕获桌面截图。
  • Launch-Tool :从开始菜单启动应用程序。
  • Shell-Tool :执行PowerShell命令。

⚠️注意

此 MCP 直接与您的 Windows 操作系统交互以执行操作。请谨慎使用,并避免将其部署在无法容忍此类风险的环境中。

🪪许可证

该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅LICENSE文件。

🤝贡献

欢迎贡献!请参阅贡献部分,了解设置说明和开发指南。

Jeomon George用❤️制作

引文

@misc{ author = {George, Jeomon}, title = {Windows-MCP}, year = {2024}, publisher = {GitHub}, howpublished = {\url{https://github.com/Jeomon/Windows-MCP}}, note = {Lightweight open-source project for integrating LLM agents with Windows} }
-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

轻量级服务器,使AI代理能够与Windows操作系统交互,从而允许通过各种工具进行文件导航、应用程序控制、UI交互和QA测试。

  1. 支持的操作系统
    1. 安装
      1. 先决条件
    2. 🏁 入门
      1. 🛠️MCP 工具
        1. ⚠️注意
          1. 🪪许可证
            1. 🤝贡献
              1. 引文

                Related MCP Servers

                • -
                  security
                  F
                  license
                  -
                  quality
                  A powerful server that enables AI agents to interact with MySQL databases, execute SQL queries, and manage database content through a simple interface.
                  Last updated -
                  25
                  4
                  JavaScript
                  • Apple
                • -
                  security
                  A
                  license
                  -
                  quality
                  An MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.
                  Last updated -
                  Python
                  MIT License
                  • Apple
                  • Linux
                • -
                  security
                  -
                  license
                  -
                  quality
                  A command-line interface server that provides unrestricted system access to Windows environments with SYSTEM-level privileges, allowing complete control over files, processes, and configuration settings.
                  Last updated -
                  TypeScript
                  MIT License
                • -
                  security
                  F
                  license
                  -
                  quality
                  A server that allows AI models to automate Microsoft Office applications (Word, Excel, PowerPoint, etc.) through COM interface on Windows, enabling natural language control of Office functions.
                  Last updated -
                  7
                  Python

                View all related MCP servers

                MCP directory API

                We provide all the information about MCP servers via our MCP API.

                curl -X GET 'https://glama.ai/api/mcp/v1/servers/CursorTouch/Windows-MCP'

                If you have feedback or need assistance with the MCP directory API, please join our Discord server