Windows-MCP

MIT License

Windows MCP — это легкий проект с открытым исходным кодом, который обеспечивает бесшовную интеграцию между агентами ИИ и операционной системой Windows. Выступая в качестве сервера MCP, мы устраняем разрыв между LLM и операционной системой Windows, позволяя агентам выполнять такие задачи, как навигация по файлам, управление приложениями, взаимодействие с пользовательским интерфейсом, тестирование QA и многое другое.

https://github.com/user-attachments/assets/45976f41-7dac-47f3-93a2-2b867feb9433

✨ Основные характеристики

  • Полная интеграция с Windows
    Взаимодействует с элементами пользовательского интерфейса Windows, открывает приложения, управляет окнами, имитирует ввод данных пользователем и многое другое.
  • Использование любого LLM (Vision Optional) В отличие от многих инструментов автоматизации, Windows MCP не полагается на какие-либо традиционные методы компьютерного зрения или специальные тонко настроенные модели; он работает с любыми LLM, что снижает сложность и время настройки.
  • Богатый набор инструментов для автоматизации пользовательского интерфейса
    Включает инструменты для базовых операций с клавиатурой, мышью и захвата состояния окна/пользовательского интерфейса.
  • Легкий и с открытым исходным кодом
    Минимальные зависимости и простая настройка с полным исходным кодом, доступным по лицензии MIT.
  • Настраиваемый и расширяемый
    Легко адаптируйте или расширяйте инструменты в соответствии с вашими уникальными потребностями в автоматизации или интеграции ИИ.
  • Взаимодействие в реальном времени
    Типичная задержка между действиями (например, от одного щелчка мыши до следующего) составляет от 4 до 8 секунд и может немного варьироваться в зависимости от количества активных приложений и загрузки системы.

Поддерживаемые операционные системы

  • Виндовс 10
  • Виндовс 11

Установка

Предпосылки

  • Питон 3.12+
  • Приложение Anthropic Claude Desktop или другие клиенты MCP
  • UV (менеджер пакетов Python), установка с помощью pip install uv

🏁 Начало работы

  1. Клонируйте репозиторий.
git clone https://github.com/Computer-Agent/Windows-MCP.git cd Windows-MCP
  1. Установить зависимости:
uv pip install -r pyproject.toml
  1. Подключиться к серверу MCP

Скопируйте приведенный ниже JSON с соответствующими значениями {{PATH}}:

{ "mcpServers": { "windows-mcp": { "command": "{{PATH_TO_UV}}", "args": [ "--directory", "{{PATH_TO_SRC}}/Windows-MCP", "run", "server.py" ] } } }

Для Claude сохраните это как claude_desktop_config.json в каталоге конфигурации Claude Desktop по адресу:

%APPDATA%/Claude/claude_desktop_config.json
  1. Перезагрузить рабочий стол Клода

Откройте Claude Desktop, и вы должны увидеть Windows-MCP как доступную интеграцию.

Для дополнительного устранения неполадок интеграции Claude Desktop см. документацию MCP . Документация содержит полезные советы по проверке журналов и решению распространенных проблем.


🛠️Инструменты MCP

Клод может получить доступ к следующим инструментам для взаимодействия с Windows:

  • Click-Tool : Щелкните по экрану в указанных координатах.
  • Type-Tool : ввод текста в элемент (при необходимости можно очистить существующий текст).
  • Clipboard-Tool : копирование или вставка с использованием системного буфера обмена.
  • Scroll-Tool : прокрутка вверх/вниз.
  • Drag-Tool : перетаскивание из одной точки в другую.
  • Move-Tool : перемещение указателя мыши.
  • Shortcut-Tool клавиш: используйте сочетания клавиш ( Ctrl+c , Alt+Tab и т. д.).
  • Key-Tool : нажмите одну клавишу.
  • Wait-Tool : пауза на определенный период времени.
  • State-Tool : комбинированный снимок активных приложений и интерактивных элементов пользовательского интерфейса.
  • Screenshot-Tool : делает снимок экрана рабочего стола.
  • Launch-Tool : для запуска приложения из меню «Пуск».
  • Shell-Tool : для выполнения команд PowerShell.

⚠️Осторожно!

Этот MCP напрямую взаимодействует с вашей операционной системой Windows для выполнения действий. Используйте его с осторожностью и избегайте развертывания в средах, где такие риски недопустимы.

🪪Лицензия

Данный проект лицензирован по лицензии MIT — подробности см. в файле LICENSE .

🤝Вклад

Вклады приветствуются! Пожалуйста, смотрите ВКЛАД для инструкций по настройке и руководства по разработке.

Сделано с ❤️ Джомоном Джорджем

-
security - not tested
A
license - permissive license
-
quality - not tested

Легкий сервер, позволяющий агентам ИИ взаимодействовать с операционной системой Windows, обеспечивая навигацию по файлам, управление приложениями, взаимодействие с пользовательским интерфейсом и тестирование качества с помощью различных инструментов.

  1. Поддерживаемые операционные системы
    1. Установка
      1. Предпосылки
    2. 🏁 Начало работы
      1. 🛠️Инструменты MCP
        1. ⚠️Осторожно!
          1. 🪪Лицензия
            1. 🤝Вклад

              Related MCP Servers

              • A
                security
                A
                license
                A
                quality
                A Model Context Protocol server that enables AI clients to interact with virtual Ubuntu desktops, allowing them to browse the web, run code, and control instances through mouse/keyboard actions and bash commands.
                Last updated -
                5
                9
                JavaScript
                MIT License
              • -
                security
                A
                license
                -
                quality
                A Model Context Protocol server that enables AI agents to interact with ClickUp workspaces, allowing task creation, management, and workspace organization through natural language commands.
                Last updated -
                376
                MIT License
              • -
                security
                F
                license
                -
                quality
                A server that enables AI systems to browse, retrieve content from, and interact with web pages through the Model Context Protocol.
                Last updated -
              • -
                security
                F
                license
                -
                quality
                A lightweight server that enables AI assistants like Cursor & Claude to read from and write to Obsidian vaults, allowing actions like creating notes, checking existing content, and managing todos through natural language.
                Last updated -
                192
                8
                TypeScript

              View all related MCP servers

              ID: g8lizqmcdh