MCP控制
模型上下文协议的 Windows 控制服务器,提供对系统操作(包括鼠标、键盘、窗口管理和屏幕捕获功能)的编程控制。
注意:该项目目前仅支持 Windows。
🔥 为什么选择 MCPControl?
MCPControl 弥合了 AI 模型和桌面之间的差距,实现了安全的程序化控制:
- 🖱️鼠标移动和点击
- ⌨️键盘输入和快捷键
- 🪟窗口管理
- 📸屏幕截图和分析
- 📋剪贴板操作
🔌 快速入门
先决条件
- 安装构建工具(包括 VC++ 工作负载)
- 安装 Python (如果尚未安装)
- 安装 Node.js
安装
- 安装 MCPControl 包
配置
MCPControl 在1280x720 分辨率的虚拟机中运行效果最佳,可实现最佳点击精度。
配置您的 Claude 客户端以通过 SSE 传输连接到 MCPControl:
选项 1:直接 SSE 连接
要连接到在 VM 或远程机器上运行的 MCPControl 服务器:
将192.168.1.100:3232
替换为您的服务器的 IP 地址和端口。
选项 2:使用 SSE 本地启动
要使用 SSE 传输在本地启动 MCPControl:
启动服务器
首先,在您的虚拟机或本地机器上启动 MCPControl 服务器:
服务器将显示:
- 可用的网络接口及其 IP 地址
- 端口号(默认值:3232)
- 连接状态消息
VM 设置示例
- 以 1280x720 分辨率启动 Windows VM
- 在虚拟机上安装 MCPControl :
- 使用 SSE 传输运行服务器:
- 记下虚拟机的 IP 地址(例如
192.168.1.100
) - 使用 SSE URL配置 Claude :
- 重新启动 Claude ,MCPControl 将出现在您的 MCP 菜单中!
🔧 CLI 选项
MCPControl 支持多个用于高级配置的命令行标志:
命令行参数
--sse
- 启用 SSE(服务器发送事件)传输以进行网络访问--port [number]
- 指定自定义端口(默认值:3232)--https
- 启用 HTTPS/TLS(根据 MCP 规范,远程部署需要)--cert [path]
- TLS 证书文件的路径(--https 需要)--key [path]
- TLS 私钥文件的路径(--https 需要)
安全说明
根据 MCP 规范,生产环境中所有基于 HTTP 的传输都必须使用 HTTPS。部署 MCPControl 进行远程访问时,请务必使用--https
标志并携带有效的 TLS 证书。
🚀 热门用例
辅助自动化
- 应用程序测试:将重复的 UI 测试委托给 Claude,让 AI 浏览应用程序并报告问题
- 工作流自动化:让 Claude 代表您操作应用程序,处理重复性任务,而您则专注于创造性工作
- 表格填写:让 Claude 在您的监督下处理数据录入任务
人工智能实验
- 人工智能游戏:观看克劳德通过视觉反馈学习玩简单游戏
- 视觉推理:测试克劳德浏览视觉界面和解决视觉谜题的能力
- 人机协作:探索新的交互范式,克劳德可以看到你的屏幕并帮助完成复杂的任务
开发和测试
- 跨应用程序集成:桥接通常不通信的应用程序
- UI 测试框架:通过视觉验证创建强大的测试场景
- 演示创建:自动创建产品演示
⚠️ 重要免责声明
本软件尚处于实验阶段,存在潜在危险
通过使用此软件,您承认并接受:
- 通过此工具让人工智能模型直接控制你的计算机本身就存在风险
- 该软件可以控制您的鼠标、键盘和其他系统功能,可能会导致意外后果
- 您自行承担使用该软件的全部风险。
- 本项目的创建者和贡献者对于因使用本软件而造成的任何损害、数据丢失或其他后果不承担任何责任
- 此工具仅应在有适当安全措施的受控环境中使用
使用风险自负
🌟 功能
🔧 自动化提供商
MCPControl 支持针对不同用例的多个自动化提供程序:
- keysender (默认)- 具有高可靠性的原生 Windows 自动化
- powershell - 基于 Windows PowerShell 的自动化,实现更简单的操作
- autohotkey - AutoHotkey v2 脚本,满足高级自动化需求
提供程序配置
您可以使用环境变量配置自动化提供程序:
或者使用模块化配置进行具体操作:
请参阅特定于提供商的文档:
🛠️ 开发设置
如果您有兴趣贡献或从源代码构建,请参阅CONTRIBUTING.md获取详细说明。
开发要求
要构建此项目进行开发,您需要:
- Windows 操作系统(keysender 依赖项所需)
- Node.js 18 或更高版本(使用包含构建工具的官方 Windows 安装程序安装)
- npm 包管理器
- 原生构建工具:
- 节点-gyp:
npm install -g node-gyp
- cmake-js:
npm install -g cmake-js
- 节点-gyp:
keysender 依赖项依赖于需要这些构建工具的 Windows 特定本机模块。
📋 项目结构
/src
/handlers
请求处理程序和工具管理/tools
核心功能实现/types
- TypeScript 类型定义index.ts
- 主应用程序入口点
🔖 仓库分支
main
- 具有最新功能和变化的主要开发分支release
- 镜像最新稳定标签的稳定发布分支(当前为 v0.2.0)
版本安装
您可以使用 npm 安装特定版本的 MCPControl:
📚 依赖项
- @modelcontextprotocol/sdk - 用于协议实现的 MCP SDK
- keysender - 仅限 Windows 的 UI 自动化库
- clipboardy——剪贴板处理
- sharp - 图像处理
- uuid - UUID 生成
🚧 已知限制
- 目前不支持窗口最小化/恢复操作
- 根据设置,多屏幕功能可能无法按预期工作
- get_screenshot 实用程序不适用于 VS Code 扩展 Cline。请参阅GitHub 问题 #1865。
- 根据目标应用程序,某些操作可能需要提升权限
- 仅支持 Windows
- MCPControl 在 1280x720 分辨率下单屏运行效果最佳。点击精度已针对此分辨率进行了优化。我们正在修复偏移/缩放错误,并正在寻找测试人员或帮助创建测试工具。
👥 贡献
⚖️ 许可证
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅 LICENSE 文件。
📖 参考文献
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
模型上下文协议的 Windows 控制服务器,提供对系统操作(包括鼠标、键盘、窗口管理和屏幕捕获功能)的编程控制。
Related MCP Servers
- AsecurityAlicenseAqualityA beginner-friendly Model Context Protocol (MCP) server that helps users understand MCP concepts, provides interactive examples, and lists available MCP servers. This server is designed to be a helpful companion for developers working with MCP. Also comes with a huge list of servers you can install.Last updated -3936JavaScriptApache 2.0
- AsecurityAlicenseAqualityA Model Context Protocol server that provides secure command-line access to Windows systems, allowing MCP clients like Claude Desktop to safely execute commands in PowerShell, CMD, and Git Bash shells with configurable security controls.Last updated -9350105JavaScriptMIT License
- -security-license-qualityA Model Context Protocol (MCP) server that interacts with system APIs, allowing users to check connections, search employees, register breakfast, and update chemical information by shifts.Last updated -2
- -securityAlicense-qualityProvides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.Last updated -6PythonMIT License