Provides browser automation capabilities including launching browsers, navigating to web pages, clicking elements, inputting text, taking screenshots, and extracting text from elements.
Click on "Install Server".
Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state.
In the chat, type
@followed by the MCP server name and your instructions, e.g., "@Windows Automation MCP Servertake a screenshot of my desktop and save it to the Pictures folder"
That's it! The server will respond to your query, and you can continue using it as needed.
Here is a step-by-step guide with screenshots.
Windows 完全自动化 MCP 服务器
这是一个功能强大的 Windows 自动化 MCP 服务器,提供完整的 Windows 系统控制能力。
🎯 功能特性
1. 文件系统操作
✅ 读写文件
✅ 创建/删除/移动/复制文件
✅ 列出目录内容
✅ 搜索文件
2. 进程管理
✅ 启动应用程序
✅ 结束进程
✅ 列出进程
✅ 获取进程信息
3. 鼠标键盘控制
⚠️ 移动鼠标
⚠️ 鼠标点击
⚠️ 输入文本
⚠️ 按键模拟
⚠️ 获取鼠标位置
⚠️ 获取屏幕尺寸
⚠️ 注意:鼠标键盘功能需要
robotjs,需要 Windows Build Tools
4. 窗口管理
✅ 列出所有窗口
✅ 获取当前活动窗口
✅ 激活窗口
✅ 关闭窗口
✅ 最小化窗口
5. 屏幕截图
✅ 全屏截图
✅ 区域截图
✅ 自定义保存路径
6. 剪贴板操作
✅ 获取剪贴板内容
✅ 设置剪贴板内容
✅ 清空剪贴板
7. PowerShell/CMD
✅ 执行 PowerShell 命令
✅ 执行 CMD 命令
✅ 获取系统信息
✅ 获取磁盘信息
✅ 获取网络信息
8. 浏览器自动化
⚠️ 启动浏览器
⚠️ 导航到网页
⚠️ 点击元素
⚠️ 输入文本
⚠️ 截图
⚠️ 获取元素文本
⚠️ 注意:浏览器功能需要
puppeteer
📦 安装
1. 基础安装(必需)
2. 可选依赖
鼠标键盘控制(robotjs)
浏览器自动化(puppeteer)
🚀 使用方法
1. 在 Cursor 中配置
在 Cursor 的 MCP 配置文件中添加:
2. 重启 Cursor
配置后重启 Cursor,MCP 服务器将自动启动。
📚 工具使用示例
文件操作
进程管理
窗口管理
屏幕截图
剪贴板
PowerShell
浏览器自动化
⚠️ 注意事项
权限要求:某些操作可能需要管理员权限
安全性:请谨慎使用 PowerShell 和 CMD 执行功能
依赖项:部分功能需要额外安装依赖
Windows 专用:此 MCP 服务器仅支持 Windows 系统
🔧 故障排除
robotjs 安装失败
puppeteer 下载失败
📝 工具列表
完整的工具列表:
文件系统 (8 个工具)
read_file, write_file, list_directory, create_directory
delete_file, copy_file, move_file, search_files
进程管理 (4 个工具)
launch_application, kill_process, list_processes, get_process_info
鼠标键盘 (6 个工具)
move_mouse, mouse_click, type_text, press_key
get_mouse_position, get_screen_size
窗口管理 (6 个工具)
list_windows, get_active_window, activate_window
close_window, minimize_window, maximize_window
屏幕截图 (2 个工具)
take_screenshot, take_screenshot_region
剪贴板 (3 个工具)
get_clipboard, set_clipboard, clear_clipboard
PowerShell (5 个工具)
run_powershell, run_cmd, get_system_info
get_disk_info, get_network_info
浏览器 (7 个工具)
browser_launch, browser_navigate, browser_click
browser_type, browser_screenshot, browser_get_text, browser_close
📄 许可证
MIT License