Skip to main content
Glama

Windows-MCP

by CursorTouch

Windows MCP — это легкий проект с открытым исходным кодом, который обеспечивает бесшовную интеграцию между агентами ИИ и операционной системой Windows. Выступая в качестве сервера MCP, мы устраняем разрыв между LLM и операционной системой Windows, позволяя агентам выполнять такие задачи, как навигация по файлам, управление приложениями, взаимодействие с пользовательским интерфейсом, тестирование QA и многое другое.

https://github.com/user-attachments/assets/d0e7ed1d-6189-4de6-838a-5ef8e1cad54e

✨ Основные характеристики

  • Полная интеграция с Windows
    Взаимодействует с элементами пользовательского интерфейса Windows, открывает приложения, управляет окнами, имитирует ввод данных пользователем и многое другое.

  • Использование любого LLM (Vision Optional) В отличие от многих инструментов автоматизации, Windows MCP не полагается на какие-либо традиционные методы компьютерного зрения или специальные тонко настроенные модели; он работает с любыми LLM, что снижает сложность и время настройки.

  • Богатый набор инструментов для автоматизации пользовательского интерфейса
    Включает инструменты для базовых операций с клавиатурой, мышью и захвата состояния окна/пользовательского интерфейса.

  • Легкий и с открытым исходным кодом
    Минимальные зависимости и простая настройка с полным исходным кодом, доступным по лицензии MIT.

  • Настраиваемый и расширяемый
    Легко адаптируйте или расширяйте инструменты в соответствии с вашими уникальными потребностями в автоматизации или интеграции ИИ.

  • Взаимодействие в реальном времени
    Типичная задержка между действиями (например, от одного щелчка мыши до следующего) составляет от 4 до 8 секунд и может немного варьироваться в зависимости от количества активных приложений и загрузки системы.

Поддерживаемые операционные системы

  • Виндовс 10

  • Виндовс 11

Установка

Предпосылки

  • Питон 3.12+

  • Приложение Anthropic Claude Desktop или другие клиенты MCP

  • UV (менеджер пакетов Python), установка с помощью pip install uv

🏁 Начало работы

  1. Клонируйте репозиторий.

git clone https://github.com/CursorTouch/Windows-MCP.git cd Windows-MCP
  1. Установите зависимости:

uv pip install -r pyproject.toml
  1. Подключиться к серверу MCP

Скопируйте приведенный ниже JSON с соответствующими значениями {{PATH}}:

{ "mcpServers": { "windows-mcp": { "command": "{{PATH_TO_UV}}", "args": [ "--directory", "{{PATH_TO_SRC}}/Windows-MCP", "run", "server.py" ] } } }

Для Claude сохраните это как claude_desktop_config.json в каталоге конфигурации Claude Desktop по адресу:

%APPDATA%/Claude/claude_desktop_config.json
  1. Перезагрузить рабочий стол Клода

Откройте Claude Desktop, и вы должны увидеть Windows-MCP как доступную интеграцию.

Для дополнительного устранения неполадок интеграции Claude Desktop см. документацию MCP . Документация содержит полезные советы по проверке журналов и решению распространенных проблем.


🛠️Инструменты MCP

Клод может получить доступ к следующим инструментам для взаимодействия с Windows:

  • Click-Tool : Щелкните по экрану в указанных координатах.

  • Type-Tool : ввод текста в элемент (при необходимости можно очистить существующий текст).

  • Clipboard-Tool : копирование или вставка с использованием системного буфера обмена.

  • Scroll-Tool : прокрутка вверх/вниз.

  • Drag-Tool : перетаскивание из одной точки в другую.

  • Move-Tool : перемещение указателя мыши.

  • Shortcut-Tool клавиш: используйте сочетания клавиш ( Ctrl+c , Alt+Tab и т. д.).

  • Key-Tool : нажмите одну клавишу.

  • Wait-Tool : пауза на определенный период времени.

  • State-Tool : комбинированный снимок активных приложений и интерактивных элементов пользовательского интерфейса.

  • Screenshot-Tool : делает снимок экрана рабочего стола.

  • Launch-Tool : для запуска приложения из меню «Пуск».

  • Shell-Tool : для выполнения команд PowerShell.

⚠️Осторожно!

Этот MCP напрямую взаимодействует с вашей операционной системой Windows для выполнения действий. Используйте его с осторожностью и избегайте развертывания в средах, где такие риски недопустимы.

🪪Лицензия

Данный проект лицензирован по лицензии MIT — подробности см. в файле LICENSE .

🤝Вклад

Вклады приветствуются! Пожалуйста, смотрите ВКЛАД для инструкций по настройке и руководства по разработке.

Сделано с ❤️ Джомоном Джорджем

Цитата

@misc{ author = {George, Jeomon}, title = {Windows-MCP}, year = {2024}, publisher = {GitHub}, howpublished = {\url{https://github.com/Jeomon/Windows-MCP}}, note = {Lightweight open-source project for integrating LLM agents with Windows} }
-
security - not tested
-
license - not tested
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Легкий сервер, позволяющий агентам ИИ взаимодействовать с операционной системой Windows, обеспечивая навигацию по файлам, управление приложениями, взаимодействие с пользовательским интерфейсом и тестирование качества с помощью различных инструментов.

  1. Поддерживаемые операционные системы
    1. Установка
      1. Предпосылки
    2. 🏁 Начало работы
      1. 🛠️Инструменты MCP
        1. ⚠️Осторожно!
          1. 🪪Лицензия
            1. 🤝Вклад
              1. Цитата

                Related MCP Servers

                • -
                  security
                  -
                  license
                  -
                  quality
                  A server that allows AI models to automate Microsoft Office applications (Word, Excel, PowerPoint, etc.) through COM interface on Windows, enabling natural language control of Office functions.
                  Last updated -
                  26
                • -
                  security
                  -
                  license
                  -
                  quality
                  A lightweight open-source server that enables AI agents to interact with the Windows operating system, allowing for file navigation, application control, UI interaction, and QA testing without requiring computer vision.
                  Last updated -
                  3,328
                  MIT License
                • -
                  security
                  -
                  license
                  -
                  quality
                  A server that enables AI assistants to control a browser through tools, allowing them to perform web automation tasks like navigation, typing, clicking, and taking screenshots.
                  Last updated -
                • A
                  security
                  -
                  license
                  A
                  quality
                  A comprehensive Model Context Protocol server that enables AI assistants to interact with and manage Windows systems, providing capabilities for file system operations, process management, system information retrieval, registry operations, service management, network diagnostics, and performance monitoring.
                  Last updated -
                  7
                  2

                View all related MCP servers

                MCP directory API

                We provide all the information about MCP servers via our MCP API.

                curl -X GET 'https://glama.ai/api/mcp/v1/servers/CursorTouch/Windows-MCP'

                If you have feedback or need assistance with the MCP directory API, please join our Discord server