Windows-MCP

by CursorTouch

Windows MCP — это легкий проект с открытым исходным кодом, который обеспечивает бесшовную интеграцию между агентами ИИ и операционной системой Windows. Выступая в качестве сервера MCP, мы устраняем разрыв между LLM и операционной системой Windows, позволяя агентам выполнять такие задачи, как навигация по файлам, управление приложениями, взаимодействие с пользовательским интерфейсом, тестирование QA и многое другое.

https://github.com/user-attachments/assets/d0e7ed1d-6189-4de6-838a-5ef8e1cad54e

✨ Основные характеристики

  • Полная интеграция с Windows
    Взаимодействует с элементами пользовательского интерфейса Windows, открывает приложения, управляет окнами, имитирует ввод данных пользователем и многое другое.
  • Использование любого LLM (Vision Optional) В отличие от многих инструментов автоматизации, Windows MCP не полагается на какие-либо традиционные методы компьютерного зрения или специальные тонко настроенные модели; он работает с любыми LLM, что снижает сложность и время настройки.
  • Богатый набор инструментов для автоматизации пользовательского интерфейса
    Включает инструменты для базовых операций с клавиатурой, мышью и захвата состояния окна/пользовательского интерфейса.
  • Легкий и с открытым исходным кодом
    Минимальные зависимости и простая настройка с полным исходным кодом, доступным по лицензии MIT.
  • Настраиваемый и расширяемый
    Легко адаптируйте или расширяйте инструменты в соответствии с вашими уникальными потребностями в автоматизации или интеграции ИИ.
  • Взаимодействие в реальном времени
    Типичная задержка между действиями (например, от одного щелчка мыши до следующего) составляет от 4 до 8 секунд и может немного варьироваться в зависимости от количества активных приложений и загрузки системы.

Поддерживаемые операционные системы

  • Виндовс 10
  • Виндовс 11

Установка

Предпосылки

  • Питон 3.12+
  • Приложение Anthropic Claude Desktop или другие клиенты MCP
  • UV (менеджер пакетов Python), установка с помощью pip install uv

🏁 Начало работы

  1. Клонируйте репозиторий.
git clone https://github.com/CursorTouch/Windows-MCP.git cd Windows-MCP
  1. Установите зависимости:
uv pip install -r pyproject.toml
  1. Подключиться к серверу MCP

Скопируйте приведенный ниже JSON с соответствующими значениями {{PATH}}:

{ "mcpServers": { "windows-mcp": { "command": "{{PATH_TO_UV}}", "args": [ "--directory", "{{PATH_TO_SRC}}/Windows-MCP", "run", "server.py" ] } } }

Для Claude сохраните это как claude_desktop_config.json в каталоге конфигурации Claude Desktop по адресу:

%APPDATA%/Claude/claude_desktop_config.json
  1. Перезагрузить рабочий стол Клода

Откройте Claude Desktop, и вы должны увидеть Windows-MCP как доступную интеграцию.

Для дополнительного устранения неполадок интеграции Claude Desktop см. документацию MCP . Документация содержит полезные советы по проверке журналов и решению распространенных проблем.


🛠️Инструменты MCP

Клод может получить доступ к следующим инструментам для взаимодействия с Windows:

  • Click-Tool : Щелкните по экрану в указанных координатах.
  • Type-Tool : ввод текста в элемент (при необходимости можно очистить существующий текст).
  • Clipboard-Tool : копирование или вставка с использованием системного буфера обмена.
  • Scroll-Tool : прокрутка вверх/вниз.
  • Drag-Tool : перетаскивание из одной точки в другую.
  • Move-Tool : перемещение указателя мыши.
  • Shortcut-Tool клавиш: используйте сочетания клавиш ( Ctrl+c , Alt+Tab и т. д.).
  • Key-Tool : нажмите одну клавишу.
  • Wait-Tool : пауза на определенный период времени.
  • State-Tool : комбинированный снимок активных приложений и интерактивных элементов пользовательского интерфейса.
  • Screenshot-Tool : делает снимок экрана рабочего стола.
  • Launch-Tool : для запуска приложения из меню «Пуск».
  • Shell-Tool : для выполнения команд PowerShell.

⚠️Осторожно!

Этот MCP напрямую взаимодействует с вашей операционной системой Windows для выполнения действий. Используйте его с осторожностью и избегайте развертывания в средах, где такие риски недопустимы.

🪪Лицензия

Данный проект лицензирован по лицензии MIT — подробности см. в файле LICENSE .

🤝Вклад

Вклады приветствуются! Пожалуйста, смотрите ВКЛАД для инструкций по настройке и руководства по разработке.

Сделано с ❤️ Джомоном Джорджем

Цитата

@misc{ author = {George, Jeomon}, title = {Windows-MCP}, year = {2024}, publisher = {GitHub}, howpublished = {\url{https://github.com/Jeomon/Windows-MCP}}, note = {Lightweight open-source project for integrating LLM agents with Windows} }
-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Легкий сервер, позволяющий агентам ИИ взаимодействовать с операционной системой Windows, обеспечивая навигацию по файлам, управление приложениями, взаимодействие с пользовательским интерфейсом и тестирование качества с помощью различных инструментов.

  1. Поддерживаемые операционные системы
    1. Установка
      1. Предпосылки
    2. 🏁 Начало работы
      1. 🛠️Инструменты MCP
        1. ⚠️Осторожно!
          1. 🪪Лицензия
            1. 🤝Вклад
              1. Цитата

                Related MCP Servers

                • A
                  security
                  A
                  license
                  A
                  quality
                  A Model Context Protocol server that enables AI clients to interact with virtual Ubuntu desktops, allowing them to browse the web, run code, and control instances through mouse/keyboard actions and bash commands.
                  Last updated -
                  5
                  9
                  JavaScript
                  MIT License
                • -
                  security
                  A
                  license
                  -
                  quality
                  A Model Context Protocol server that enables AI agents to interact with ClickUp workspaces, allowing task creation, management, and workspace organization through natural language commands.
                  Last updated -
                  255
                  MIT License
                • -
                  security
                  F
                  license
                  -
                  quality
                  A server that enables AI systems to browse, retrieve content from, and interact with web pages through the Model Context Protocol.
                  Last updated -
                • -
                  security
                  F
                  license
                  -
                  quality
                  A lightweight server that enables AI assistants like Cursor & Claude to read from and write to Obsidian vaults, allowing actions like creating notes, checking existing content, and managing todos through natural language.
                  Last updated -
                  192
                  8
                  TypeScript

                View all related MCP servers

                ID: g8lizqmcdh