Windows MCP — это легкий проект с открытым исходным кодом, который обеспечивает бесшовную интеграцию между агентами ИИ и операционной системой Windows. Выступая в качестве сервера MCP, мы устраняем разрыв между LLM и операционной системой Windows, позволяя агентам выполнять такие задачи, как навигация по файлам, управление приложениями, взаимодействие с пользовательским интерфейсом, тестирование QA и многое другое.
https://github.com/user-attachments/assets/d0e7ed1d-6189-4de6-838a-5ef8e1cad54e
✨ Основные характеристики
- Полная интеграция с Windows
Взаимодействует с элементами пользовательского интерфейса Windows, открывает приложения, управляет окнами, имитирует ввод данных пользователем и многое другое. - Использование любого LLM (Vision Optional) В отличие от многих инструментов автоматизации, Windows MCP не полагается на какие-либо традиционные методы компьютерного зрения или специальные тонко настроенные модели; он работает с любыми LLM, что снижает сложность и время настройки.
- Богатый набор инструментов для автоматизации пользовательского интерфейса
Включает инструменты для базовых операций с клавиатурой, мышью и захвата состояния окна/пользовательского интерфейса. - Легкий и с открытым исходным кодом
Минимальные зависимости и простая настройка с полным исходным кодом, доступным по лицензии MIT. - Настраиваемый и расширяемый
Легко адаптируйте или расширяйте инструменты в соответствии с вашими уникальными потребностями в автоматизации или интеграции ИИ. - Взаимодействие в реальном времени
Типичная задержка между действиями (например, от одного щелчка мыши до следующего) составляет от 4 до 8 секунд и может немного варьироваться в зависимости от количества активных приложений и загрузки системы.
Поддерживаемые операционные системы
- Виндовс 10
- Виндовс 11
Установка
Предпосылки
- Питон 3.12+
- Приложение Anthropic Claude Desktop или другие клиенты MCP
- UV (менеджер пакетов Python), установка с помощью
pip install uv
🏁 Начало работы
- Клонируйте репозиторий.
- Установите зависимости:
- Подключиться к серверу MCP
Скопируйте приведенный ниже JSON с соответствующими значениями {{PATH}}:
Для Claude сохраните это как claude_desktop_config.json в каталоге конфигурации Claude Desktop по адресу:
- Перезагрузить рабочий стол Клода
Откройте Claude Desktop, и вы должны увидеть Windows-MCP как доступную интеграцию.
Для дополнительного устранения неполадок интеграции Claude Desktop см. документацию MCP . Документация содержит полезные советы по проверке журналов и решению распространенных проблем.
🛠️Инструменты MCP
Клод может получить доступ к следующим инструментам для взаимодействия с Windows:
Click-Tool
: Щелкните по экрану в указанных координатах.Type-Tool
: ввод текста в элемент (при необходимости можно очистить существующий текст).Clipboard-Tool
: копирование или вставка с использованием системного буфера обмена.Scroll-Tool
: прокрутка вверх/вниз.Drag-Tool
: перетаскивание из одной точки в другую.Move-Tool
: перемещение указателя мыши.Shortcut-Tool
клавиш: используйте сочетания клавиш (Ctrl+c
,Alt+Tab
и т. д.).Key-Tool
: нажмите одну клавишу.Wait-Tool
: пауза на определенный период времени.State-Tool
: комбинированный снимок активных приложений и интерактивных элементов пользовательского интерфейса.Screenshot-Tool
: делает снимок экрана рабочего стола.Launch-Tool
: для запуска приложения из меню «Пуск».Shell-Tool
: для выполнения команд PowerShell.
⚠️Осторожно!
Этот MCP напрямую взаимодействует с вашей операционной системой Windows для выполнения действий. Используйте его с осторожностью и избегайте развертывания в средах, где такие риски недопустимы.
🪪Лицензия
Данный проект лицензирован по лицензии MIT — подробности см. в файле LICENSE .
🤝Вклад
Вклады приветствуются! Пожалуйста, смотрите ВКЛАД для инструкций по настройке и руководства по разработке.
Сделано с ❤️ Джомоном Джорджем
Цитата
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Легкий сервер, позволяющий агентам ИИ взаимодействовать с операционной системой Windows, обеспечивая навигацию по файлам, управление приложениями, взаимодействие с пользовательским интерфейсом и тестирование качества с помощью различных инструментов.
Related MCP Servers
- -securityFlicense-qualityA powerful server that enables AI agents to interact with MySQL databases, execute SQL queries, and manage database content through a simple interface.Last updated -254JavaScript
- -securityAlicense-qualityAn MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.Last updated -PythonMIT License
- -security-license-qualityA command-line interface server that provides unrestricted system access to Windows environments with SYSTEM-level privileges, allowing complete control over files, processes, and configuration settings.Last updated -TypeScriptMIT License
- -securityFlicense-qualityA server that allows AI models to automate Microsoft Office applications (Word, Excel, PowerPoint, etc.) through COM interface on Windows, enabling natural language control of Office functions.Last updated -7Python