Windows-MCP

MIT License

Windows MCP是一个轻量级的开源项目,它支持 AI 代理与 Windows 操作系统之间的无缝集成。作为 MCP 服务器,它可以弥合 LLM 与 Windows 操作系统之间的差距,使代理能够执行文件导航、应用程序控制、UI 交互、QA 测试等任务。

https://github.com/user-attachments/assets/45976f41-7dac-47f3-93a2-2b867feb9433

✨ 主要特点

  • 无缝 Windows 集成
    与 Windows UI 元素进行本机交互、打开应用程序、控制窗口、模拟用户输入等。
  • **使用任何 LLM(视觉可选)**与许多自动化工具不同,Windows MCP 不依赖任何传统的计算机视觉技术或特定的微调模型;它适用于任何 LLM,从而降低了复杂性和设置时间。
  • 丰富的 UI 自动化工具集
    包括用于基本键盘、鼠标操作和捕获窗口/UI 状态的工具。
  • 轻量级和开源
    依赖性最小,设置简单,完整源代码可在 MIT 许可下获得。
  • 可定制且可扩展
    轻松调整或扩展工具以满足您独特的自动化或 AI 集成需求。
  • 实时互动
    操作之间的典型延迟(例如,从一次鼠标单击到下一次鼠标单击)范围为4 到 8 秒,并且可能根据活动应用程序的数量和系统负载而略有不同。

支持的操作系统

  • Windows 10
  • Windows 11

安装

先决条件

  • Python 3.12+
  • Anthropic Claude 桌面应用程序或其他 MCP 客户端
  • UV(Python 包管理器),使用pip install uv安装

🏁 入门

  1. 克隆存储库。
git clone https://github.com/Computer-Agent/Windows-MCP.git cd Windows-MCP
  1. 安装依赖项:
uv pip install -r pyproject.toml
  1. 连接到 MCP 服务器

使用适当的 {{PATH}} 值复制以下 JSON:

{ "mcpServers": { "windows-mcp": { "command": "{{PATH_TO_UV}}", "args": [ "--directory", "{{PATH_TO_SRC}}/Windows-MCP", "run", "server.py" ] } } }

对于 Claude,将其保存为 claude_desktop_config.json,保存在 Claude Desktop 配置目录中:

%APPDATA%/Claude/claude_desktop_config.json
  1. 重启Claude桌面

打开 Claude Desktop,您现在应该看到 Windows-MCP 作为可用的集成。

有关 Claude Desktop 集成故障排除的更多内容,请参阅MCP 文档。该文档包含检查日志和解决常见问题的实用技巧。


🛠️MCP 工具

Claude 可以访问以下工具与 Windows 进行交互:

  • Click-Tool :在给定的坐标处点击屏幕。
  • Type-Tool :在元素上输入文本(可选择清除现有文本)。
  • Clipboard-Tool :使用系统剪贴板复制或粘贴。
  • Scroll-Tool :向上/向下滚动。
  • Drag-Tool :从一个点拖动到另一个点。
  • Move-Tool :移动鼠标指针。
  • Shortcut-Tool :按键盘快捷键( Ctrl+cAlt+Tab等)。
  • Key-Tool :按下一个键。
  • Wait-Tool :暂停一段定义的时间。
  • State-Tool :活动应用程序和交互式 UI 元素的组合快照。
  • Screenshot-Tool :捕获桌面截图。
  • Launch-Tool :从开始菜单启动应用程序。
  • Shell-Tool :执行PowerShell命令。

⚠️注意

此 MCP 直接与您的 Windows 操作系统交互以执行操作。请谨慎使用,并避免将其部署在无法容忍此类风险的环境中。

🪪许可证

该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅LICENSE文件。

🤝贡献

欢迎贡献!请参阅贡献部分,了解设置说明和开发指南。

Jeomon George用❤️制作

-
security - not tested
A
license - permissive license
-
quality - not tested

轻量级服务器,使AI代理能够与Windows操作系统交互,从而允许通过各种工具进行文件导航、应用程序控制、UI交互和QA测试。

  1. 支持的操作系统
    1. 安装
      1. 先决条件
    2. 🏁 入门
      1. 🛠️MCP 工具
        1. ⚠️注意
          1. 🪪许可证
            1. 🤝贡献

              Related MCP Servers

              • A
                security
                A
                license
                A
                quality
                A Model Context Protocol server that enables AI clients to interact with virtual Ubuntu desktops, allowing them to browse the web, run code, and control instances through mouse/keyboard actions and bash commands.
                Last updated -
                5
                9
                JavaScript
                MIT License
              • -
                security
                A
                license
                -
                quality
                A Model Context Protocol server that enables AI agents to interact with ClickUp workspaces, allowing task creation, management, and workspace organization through natural language commands.
                Last updated -
                376
                MIT License
              • -
                security
                F
                license
                -
                quality
                A server that enables AI systems to browse, retrieve content from, and interact with web pages through the Model Context Protocol.
                Last updated -
              • -
                security
                F
                license
                -
                quality
                A lightweight server that enables AI assistants like Cursor & Claude to read from and write to Obsidian vaults, allowing actions like creating notes, checking existing content, and managing todos through natural language.
                Last updated -
                192
                8
                TypeScript

              View all related MCP servers

              ID: g8lizqmcdh