Windows MCP是一个轻量级的开源项目,它支持 AI 代理与 Windows 操作系统之间的无缝集成。作为 MCP 服务器,它可以弥合 LLM 与 Windows 操作系统之间的差距,使代理能够执行文件导航、应用程序控制、UI 交互、QA 测试等任务。
https://github.com/user-attachments/assets/d0e7ed1d-6189-4de6-838a-5ef8e1cad54e
✨ 主要特点
- 无缝 Windows 集成
与 Windows UI 元素进行本机交互、打开应用程序、控制窗口、模拟用户输入等。 - **使用任何 LLM(视觉可选)**与许多自动化工具不同,Windows MCP 不依赖任何传统的计算机视觉技术或特定的微调模型;它适用于任何 LLM,从而降低了复杂性和设置时间。
- 丰富的 UI 自动化工具集
包括用于基本键盘、鼠标操作和捕获窗口/UI 状态的工具。 - 轻量级和开源
依赖性最小,设置简单,完整源代码可在 MIT 许可下获得。 - 可定制且可扩展
轻松调整或扩展工具以满足您独特的自动化或 AI 集成需求。 - 实时互动
操作之间的典型延迟(例如,从一次鼠标单击到下一次鼠标单击)范围为4 到 8 秒,并且可能根据活动应用程序的数量和系统负载而略有不同。
支持的操作系统
- Windows 10
- Windows 11
安装
先决条件
- Python 3.12+
- Anthropic Claude 桌面应用程序或其他 MCP 客户端
- UV(Python 包管理器),使用
pip install uv
安装
🏁 入门
- 克隆存储库。
- 安装依赖项:
- 连接到 MCP 服务器
使用适当的 {{PATH}} 值复制以下 JSON:
对于 Claude,将其保存为 claude_desktop_config.json,保存在 Claude Desktop 配置目录中:
- 重启Claude桌面
打开 Claude Desktop,您现在应该看到 Windows-MCP 作为可用的集成。
有关 Claude Desktop 集成故障排除的更多内容,请参阅MCP 文档。该文档包含检查日志和解决常见问题的实用技巧。
🛠️MCP 工具
Claude 可以访问以下工具与 Windows 进行交互:
Click-Tool
:在给定的坐标处点击屏幕。Type-Tool
:在元素上输入文本(可选择清除现有文本)。Clipboard-Tool
:使用系统剪贴板复制或粘贴。Scroll-Tool
:向上/向下滚动。Drag-Tool
:从一个点拖动到另一个点。Move-Tool
:移动鼠标指针。Shortcut-Tool
:按键盘快捷键(Ctrl+c
、Alt+Tab
等)。Key-Tool
:按下一个键。Wait-Tool
:暂停一段定义的时间。State-Tool
:活动应用程序和交互式 UI 元素的组合快照。Screenshot-Tool
:捕获桌面截图。Launch-Tool
:从开始菜单启动应用程序。Shell-Tool
:执行PowerShell命令。
⚠️注意
此 MCP 直接与您的 Windows 操作系统交互以执行操作。请谨慎使用,并避免将其部署在无法容忍此类风险的环境中。
🪪许可证
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅LICENSE文件。
🤝贡献
欢迎贡献!请参阅贡献部分,了解设置说明和开发指南。
由Jeomon George用❤️制作
引文
Related MCP Servers
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI clients to interact with virtual Ubuntu desktops, allowing them to browse the web, run code, and control instances through mouse/keyboard actions and bash commands.Last updated -59JavaScriptMIT License
- -securityAlicense-qualityA Model Context Protocol server that enables AI agents to interact with ClickUp workspaces, allowing task creation, management, and workspace organization through natural language commands.Last updated -255MIT License
- -securityFlicense-qualityA server that enables AI systems to browse, retrieve content from, and interact with web pages through the Model Context Protocol.Last updated -
- -securityFlicense-qualityA lightweight server that enables AI assistants like Cursor & Claude to read from and write to Obsidian vaults, allowing actions like creating notes, checking existing content, and managing todos through natural language.Last updated -1928TypeScript