Skip to main content
Glama

Windows Automation MCP Server

功能清单.md9.93 kB
# Windows 自动化 MCP - 完整功能清单 这个 MCP 提供了 **41 个自动化工具**,让您可以用自然语言完全控制 Windows 系统。 ## 📁 文件系统操作(8 个工具) ### 1. `read_file` - 读取文件 ``` "请读取桌面上的 readme.txt 文件" "请帮我查看 D:\logs\error.log 的内容" ``` ### 2. `write_file` - 写入文件 ``` "请在 D:\temp 创建一个 hello.txt 文件,内容是 Hello World" "请把这段代码保存到 C:\scripts\backup.ps1" ``` ### 3. `list_directory` - 列出目录 ``` "请列出我桌面上的所有文件和文件夹" "请看看 C:\Windows\System32 里有什么" ``` ### 4. `create_directory` - 创建目录 ``` "请在 D:\Projects 创建一个名为 MyApp 的文件夹" "请创建目录结构 C:\backup\2024\01" ``` ### 5. `delete_file` - 删除文件/目录 ``` "请删除桌面上的 temp.txt" "请删除 C:\temp 整个文件夹" ``` ### 6. `copy_file` - 复制文件 ``` "请把桌面上的 report.pdf 复制到 D:\backup" "请复制 config.ini 到备份目录" ``` ### 7. `move_file` - 移动/重命名文件 ``` "请把 old_name.txt 重命名为 new_name.txt" "请将所有 PDF 文件移动到 Documents 文件夹" ``` ### 8. `search_files` - 搜索文件 ``` "请在 C:\Users 目录下搜索所有 .log 文件" "请找出所有名称包含 backup 的文件" ``` --- ## ⚙️ 进程管理(4 个工具) ### 9. `launch_application` - 启动程序 ``` "请打开记事本" "请启动 Chrome 浏览器" "请用记事本打开 C:\config.txt" "请启动 PowerShell 并执行命令" ``` ### 10. `kill_process` - 结束进程 ``` "请结束 notepad.exe 进程" "请强制关闭所有 Chrome 进程" "请结束卡住的程序" ``` ### 11. `list_processes` - 列出进程 ``` "请列出所有正在运行的进程" "请显示所有 Chrome 相关的进程" "请查看当前有多少个进程在运行" ``` ### 12. `get_process_info` - 获取进程信息 ``` "请查看 chrome.exe 的详细信息" "请告诉我 notepad.exe 占用了多少内存" ``` --- ## 🪟 窗口管理(6 个工具) ### 13. `list_windows` - 列出所有窗口 ``` "请列出所有打开的窗口" "请显示所有包含 Chrome 的窗口" "请查看当前有哪些窗口在运行" ``` ### 14. `get_active_window` - 获取当前活动窗口 ``` "请告诉我当前激活的是哪个窗口" "请查看我正在使用什么程序" ``` ### 15. `activate_window` - 激活窗口 ``` "请激活标题包含'记事本'的窗口" "请切换到 Chrome 浏览器窗口" "请把 Visual Studio 窗口切换到前台" ``` ### 16. `close_window` - 关闭窗口 ``` "请关闭标题包含'未保存'的记事本窗口" "请关闭所有 Chrome 窗口" ``` ### 17. `minimize_window` - 最小化窗口 ``` "请最小化所有窗口" "请最小化 Chrome 浏览器" ``` ### 18. `maximize_window` - 最大化窗口 ``` "请最大化当前窗口" ``` --- ## 📸 屏幕截图(2 个工具) ### 19. `take_screenshot` - 全屏截图 ``` "请截取当前屏幕并保存到桌面" "请截图保存为 screenshot.png" "请截图保存到 D:\screenshots\test.jpg" ``` ### 20. `take_screenshot_region` - 区域截图 ``` "请截取屏幕左上角 800x600 的区域" "请截取坐标 (100,100) 开始,大小 1024x768 的区域" ``` --- ## 📋 剪贴板操作(3 个工具) ### 21. `get_clipboard` - 获取剪贴板内容 ``` "请告诉我剪贴板里现在是什么" "请读取剪贴板内容" ``` ### 22. `set_clipboard` - 设置剪贴板内容 ``` "请将 'Hello World' 复制到剪贴板" "请把这段文本复制到剪贴板" "请把我的邮箱 test@example.com 复制到剪贴板" ``` ### 23. `clear_clipboard` - 清空剪贴板 ``` "请清空剪贴板" "请清除剪贴板内容" ``` --- ## 💻 PowerShell/CMD 执行(5 个工具) ### 24. `run_powershell` - 执行 PowerShell 命令 ``` "请执行 PowerShell 命令:Get-Process | Select-Object -First 10" "请用 PowerShell 查看当前时间" "请执行 PowerShell 脚本获取系统信息" ``` ### 25. `run_cmd` - 执行 CMD 命令 ``` "请执行命令:ipconfig" "请运行 dir C:\Windows" "请执行 netstat -an 查看网络连接" ``` ### 26. `get_system_info` - 获取系统信息 ``` "请获取当前系统的详细信息" "请告诉我系统版本、CPU、内存等信息" "请查看计算机配置" ``` ### 27. `get_disk_info` - 获取磁盘信息 ``` "请查看所有磁盘的使用情况" "请告诉我 C 盘还有多少空间" "请查看磁盘容量和剩余空间" ``` ### 28. `get_network_info` - 获取网络信息 ``` "请获取当前的网络配置" "请查看 IP 地址" "请显示所有网络接口信息" ``` --- ## 🌐 浏览器自动化(7 个工具) ### 29. `browser_launch` - 启动浏览器 ``` "请启动浏览器" "请打开无头浏览器" "请启动一个新的浏览器会话" ``` ### 30. `browser_navigate` - 导航到网页 ``` "请访问 https://www.baidu.com" "请在浏览器中打开百度" "请导航到 Google 首页" ``` ### 31. `browser_click` - 点击页面元素 ``` "请点击页面上的搜索按钮" "请点击 #submit 按钮" "请点击 class 为 'btn-primary' 的元素" ``` ### 32. `browser_type` - 在页面输入文本 ``` "请在搜索框输入 'Hello World'" "请在 #username 输入框填写用户名" ``` ### 33. `browser_screenshot` - 网页截图 ``` "请截取当前网页的完整截图" "请截取网页可见区域" "请保存网页截图到桌面" ``` ### 34. `browser_get_text` - 获取元素文本 ``` "请获取页面标题" "请读取 #content 元素的文本" "请提取页面上的所有链接文本" ``` ### 35. `browser_close` - 关闭浏览器 ``` "请关闭浏览器" "请结束浏览器会话" ``` --- ## ⌨️ 鼠标键盘控制(6 个工具) > ⚠️ **注意**:这些工具需要额外安装 `robotjs`,需要 Visual Studio Build Tools ### 36. `move_mouse` - 移动鼠标 ``` "请将鼠标移动到坐标 (100, 200)" "请平滑移动鼠标到屏幕中心" ``` ### 37. `mouse_click` - 鼠标点击 ``` "请鼠标左键单击" "请鼠标右键点击" "请双击" ``` ### 38. `type_text` - 输入文本 ``` "请输入 Hello World" "请慢慢输入这段文本(每个字符延迟 100ms)" ``` ### 39. `press_key` - 按键 ``` "请按下回车键" "请按 Ctrl+C" "请按 Ctrl+Alt+Delete" ``` ### 40. `get_mouse_position` - 获取鼠标位置 ``` "请告诉我当前鼠标位置" "请获取鼠标坐标" ``` ### 41. `get_screen_size` - 获取屏幕尺寸 ``` "请告诉我屏幕分辨率" "请查看屏幕大小" ``` --- ## 🎯 复杂自动化场景示例 ### 场景 1:自动备份文件 ``` 请帮我做以下操作: 1. 列出桌面上所有的 .docx 文件 2. 在 D:\Backup\Documents 创建备份目录 3. 将这些文件复制到备份目录 4. 生成一个备份报告,包含文件名和时间 5. 将报告保存到桌面 ``` ### 场景 2:系统健康检查 ``` 请帮我检查系统状态: 1. 获取系统基本信息(CPU、内存、版本) 2. 查看所有磁盘的使用情况 3. 列出占用内存最多的 10 个进程 4. 获取当前网络配置 5. 将所有信息整理成报告保存到桌面 ``` ### 场景 3:批量文件整理 ``` 请帮我整理桌面: 1. 列出桌面所有文件 2. 创建 "图片"、"文档"、"其他" 三个文件夹 3. 把 .jpg、.png 文件移到图片文件夹 4. 把 .pdf、.docx、.txt 移到文档文件夹 5. 其余文件移到其他文件夹 6. 报告整理结果 ``` ### 场景 4:网页数据抓取 ``` 请帮我从网页获取信息: 1. 启动浏览器 2. 访问 https://example.com 3. 获取页面标题 4. 提取页面上的主要内容 5. 截取页面完整截图 6. 将提取的信息保存到文件 7. 关闭浏览器 ``` ### 场景 5:开发环境快速启动 ``` 请帮我启动开发环境: 1. 打开 VS Code 2. 启动 Chrome 浏览器 3. 打开 PowerShell 终端 4. 在终端中 cd 到项目目录 5. 执行 npm start 6. 将所有窗口排列整齐 ``` ### 场景 6:定时截图监控 ``` 请每隔 5 分钟: 1. 截取当前屏幕 2. 保存到 D:\Screenshots 目录 3. 文件名使用时间戳 4. 如果文件夹超过 100 张截图,删除最旧的 ``` --- ## 💡 使用技巧 ### 1. 组合使用多个工具 ``` 请帮我: 1. 列出 D:\logs 目录下所有 .log 文件 2. 读取每个文件的最后 10 行 3. 如果包含 "ERROR",复制到剪贴板 4. 并截图保存 ``` ### 2. 条件判断 ``` 请检查 C:\temp 目录: - 如果存在就列出内容 - 如果不存在就创建它 ``` ### 3. 循环操作 ``` 请对桌面上的每个 .txt 文件: 1. 读取内容 2. 在开头添加当前时间戳 3. 保存回原文件 ``` ### 4. 错误处理 ``` 请尝试打开记事本: - 如果成功,在其中输入 "Hello" - 如果失败,记录错误并尝试使用完整路径 - 如果还是失败,报告给我 ``` --- ## 🔧 技术细节 ### 依赖项 - ✅ **Node.js** (必需) - ✅ **@modelcontextprotocol/sdk** (已安装) - ✅ **Puppeteer** (已安装 - 浏览器自动化) - ⚠️ **robotjs** (可选 - 鼠标键盘控制,需要 VS Build Tools) ### 系统要求 - Windows 10/11 - Node.js 18+ - PowerShell 5.1+ ### 权限 - 大部分操作无需管理员权限 - 某些系统级操作可能需要提升权限 --- ## 📊 功能统计 | 类别 | 工具数量 | 安装状态 | |------|---------|---------| | 文件系统 | 8 | ✅ 已安装 | | 进程管理 | 4 | ✅ 已安装 | | 窗口管理 | 6 | ✅ 已安装 | | 屏幕截图 | 2 | ✅ 已安装 | | 剪贴板 | 3 | ✅ 已安装 | | PowerShell/CMD | 5 | ✅ 已安装 | | 浏览器自动化 | 7 | ✅ 已安装 | | 鼠标键盘 | 6 | ⚠️ 需额外安装 | | **总计** | **41** | **35 已就绪** | --- ## 🎉 开始使用 现在就在 Cursor 中试试这些命令吧! 用自然语言描述你想做什么,AI 会自动调用合适的工具完成任务。 **Windows 系统,完全由你掌控!** 🚀

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/eva-wanxin-git/windows-automation-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server