Windows MCP — это легкий проект с открытым исходным кодом, который обеспечивает бесшовную интеграцию между агентами ИИ и операционной системой Windows. Выступая в качестве сервера MCP, мы устраняем разрыв между LLM и операционной системой Windows, позволяя агентам выполнять такие задачи, как навигация по файлам, управление приложениями, взаимодействие с пользовательским интерфейсом, тестирование QA и многое другое.
https://github.com/user-attachments/assets/45976f41-7dac-47f3-93a2-2b867feb9433
✨ Основные характеристики
- Полная интеграция с Windows
Взаимодействует с элементами пользовательского интерфейса Windows, открывает приложения, управляет окнами, имитирует ввод данных пользователем и многое другое. - Использование любого LLM (Vision Optional) В отличие от многих инструментов автоматизации, Windows MCP не полагается на какие-либо традиционные методы компьютерного зрения или специальные тонко настроенные модели; он работает с любыми LLM, что снижает сложность и время настройки.
- Богатый набор инструментов для автоматизации пользовательского интерфейса
Включает инструменты для базовых операций с клавиатурой, мышью и захвата состояния окна/пользовательского интерфейса. - Легкий и с открытым исходным кодом
Минимальные зависимости и простая настройка с полным исходным кодом, доступным по лицензии MIT. - Настраиваемый и расширяемый
Легко адаптируйте или расширяйте инструменты в соответствии с вашими уникальными потребностями в автоматизации или интеграции ИИ. - Взаимодействие в реальном времени
Типичная задержка между действиями (например, от одного щелчка мыши до следующего) составляет от 4 до 8 секунд и может немного варьироваться в зависимости от количества активных приложений и загрузки системы.
Поддерживаемые операционные системы
- Виндовс 10
- Виндовс 11
Установка
Предпосылки
- Питон 3.12+
- Приложение Anthropic Claude Desktop или другие клиенты MCP
- UV (менеджер пакетов Python), установка с помощью
pip install uv
🏁 Начало работы
- Клонируйте репозиторий.
- Установить зависимости:
- Подключиться к серверу MCP
Скопируйте приведенный ниже JSON с соответствующими значениями {{PATH}}:
Для Claude сохраните это как claude_desktop_config.json в каталоге конфигурации Claude Desktop по адресу:
- Перезагрузить рабочий стол Клода
Откройте Claude Desktop, и вы должны увидеть Windows-MCP как доступную интеграцию.
Для дополнительного устранения неполадок интеграции Claude Desktop см. документацию MCP . Документация содержит полезные советы по проверке журналов и решению распространенных проблем.
🛠️Инструменты MCP
Клод может получить доступ к следующим инструментам для взаимодействия с Windows:
Click-Tool
: Щелкните по экрану в указанных координатах.Type-Tool
: ввод текста в элемент (при необходимости можно очистить существующий текст).Clipboard-Tool
: копирование или вставка с использованием системного буфера обмена.Scroll-Tool
: прокрутка вверх/вниз.Drag-Tool
: перетаскивание из одной точки в другую.Move-Tool
: перемещение указателя мыши.Shortcut-Tool
клавиш: используйте сочетания клавиш (Ctrl+c
,Alt+Tab
и т. д.).Key-Tool
: нажмите одну клавишу.Wait-Tool
: пауза на определенный период времени.State-Tool
: комбинированный снимок активных приложений и интерактивных элементов пользовательского интерфейса.Screenshot-Tool
: делает снимок экрана рабочего стола.Launch-Tool
: для запуска приложения из меню «Пуск».Shell-Tool
: для выполнения команд PowerShell.
⚠️Осторожно!
Этот MCP напрямую взаимодействует с вашей операционной системой Windows для выполнения действий. Используйте его с осторожностью и избегайте развертывания в средах, где такие риски недопустимы.
🪪Лицензия
Данный проект лицензирован по лицензии MIT — подробности см. в файле LICENSE .
🤝Вклад
Вклады приветствуются! Пожалуйста, смотрите ВКЛАД для инструкций по настройке и руководства по разработке.
Сделано с ❤️ Джомоном Джорджем
This server cannot be installed
Легкий сервер, позволяющий агентам ИИ взаимодействовать с операционной системой Windows, обеспечивая навигацию по файлам, управление приложениями, взаимодействие с пользовательским интерфейсом и тестирование качества с помощью различных инструментов.
Related MCP Servers
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI clients to interact with virtual Ubuntu desktops, allowing them to browse the web, run code, and control instances through mouse/keyboard actions and bash commands.Last updated -59JavaScriptMIT License
- -securityAlicense-qualityA Model Context Protocol server that enables AI agents to interact with ClickUp workspaces, allowing task creation, management, and workspace organization through natural language commands.Last updated -376MIT License
- -securityFlicense-qualityA server that enables AI systems to browse, retrieve content from, and interact with web pages through the Model Context Protocol.Last updated -
- -securityFlicense-qualityA lightweight server that enables AI assistants like Cursor & Claude to read from and write to Obsidian vaults, allowing actions like creating notes, checking existing content, and managing todos through natural language.Last updated -1928TypeScript