Windows MCP是一个轻量级的开源项目,它支持 AI 代理与 Windows 操作系统之间的无缝集成。作为 MCP 服务器,它可以弥合 LLM 与 Windows 操作系统之间的差距,使代理能够执行文件导航、应用程序控制、UI 交互、QA 测试等任务。
https://github.com/user-attachments/assets/45976f41-7dac-47f3-93a2-2b867feb9433
✨ 主要特点
- 无缝 Windows 集成
与 Windows UI 元素进行本机交互、打开应用程序、控制窗口、模拟用户输入等。 - **使用任何 LLM(视觉可选)**与许多自动化工具不同,Windows MCP 不依赖任何传统的计算机视觉技术或特定的微调模型;它适用于任何 LLM,从而降低了复杂性和设置时间。
- 丰富的 UI 自动化工具集
包括用于基本键盘、鼠标操作和捕获窗口/UI 状态的工具。 - 轻量级和开源
依赖性最小,设置简单,完整源代码可在 MIT 许可下获得。 - 可定制且可扩展
轻松调整或扩展工具以满足您独特的自动化或 AI 集成需求。 - 实时互动
操作之间的典型延迟(例如,从一次鼠标单击到下一次鼠标单击)范围为4 到 8 秒,并且可能根据活动应用程序的数量和系统负载而略有不同。
支持的操作系统
安装
先决条件
- Python 3.12+
- Anthropic Claude 桌面应用程序或其他 MCP 客户端
- UV(Python 包管理器),使用
pip install uv
安装
🏁 入门
- 克隆存储库。
git clone https://github.com/Computer-Agent/Windows-MCP.git
cd Windows-MCP
- 安装依赖项:
uv pip install -r pyproject.toml
- 连接到 MCP 服务器
使用适当的 {{PATH}} 值复制以下 JSON:
{
"mcpServers": {
"windows-mcp": {
"command": "{{PATH_TO_UV}}",
"args": [
"--directory",
"{{PATH_TO_SRC}}/Windows-MCP",
"run",
"server.py"
]
}
}
}
对于 Claude,将其保存为 claude_desktop_config.json,保存在 Claude Desktop 配置目录中:
%APPDATA%/Claude/claude_desktop_config.json
- 重启Claude桌面
打开 Claude Desktop,您现在应该看到 Windows-MCP 作为可用的集成。
有关 Claude Desktop 集成故障排除的更多内容,请参阅MCP 文档。该文档包含检查日志和解决常见问题的实用技巧。
🛠️MCP 工具
Claude 可以访问以下工具与 Windows 进行交互:
Click-Tool
:在给定的坐标处点击屏幕。Type-Tool
:在元素上输入文本(可选择清除现有文本)。Clipboard-Tool
:使用系统剪贴板复制或粘贴。Scroll-Tool
:向上/向下滚动。Drag-Tool
:从一个点拖动到另一个点。Move-Tool
:移动鼠标指针。Shortcut-Tool
:按键盘快捷键( Ctrl+c
、 Alt+Tab
等)。Key-Tool
:按下一个键。Wait-Tool
:暂停一段定义的时间。State-Tool
:活动应用程序和交互式 UI 元素的组合快照。Screenshot-Tool
:捕获桌面截图。Launch-Tool
:从开始菜单启动应用程序。Shell-Tool
:执行PowerShell命令。
⚠️注意
此 MCP 直接与您的 Windows 操作系统交互以执行操作。请谨慎使用,并避免将其部署在无法容忍此类风险的环境中。
🪪许可证
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅LICENSE文件。
🤝贡献
欢迎贡献!请参阅贡献部分,了解设置说明和开发指南。
由Jeomon George用❤️制作