Skip to main content
Glama

Computer Control MCP

by AB498

Компьютерное управление MCP

MCP-сервер, который обеспечивает возможности управления компьютером, такие как мышь, клавиатура, OCR и т. д. с использованием PyAutoGUI, RapidOCR, ONNXRuntime. Аналогично 'computer-use' от Anthropic. С нулевыми внешними зависимостями.

  • Протестировано только на Windows. Должно работать на других платформах.

Демонстрация управления компьютером MCP

Быстрое использование (настройка MCP с использованием uvx )

Примечание: запуск uvx computer-control-mcp@latest в первый раз загрузит зависимости python (около 70 МБ), что может занять некоторое время. Рекомендуется запустить это в терминале перед использованием его в качестве MCP. Последующие запуски будут мгновенными.

{ "mcpServers": { "computer-control-mcp": { "command": "uvx", "args": ["computer-control-mcp@latest"] } } }

ИЛИ установите глобально с помощью pip :

pip install computer-control-mcp

Затем запустите сервер с помощью:

computer-control-mcp # instead of uvx computer-control-mcp, so you can use the latest version, also you can `uv cache clean` to clear the cache and `uvx` again to use latest version.

Функции

  • Управление движениями и щелчками мыши
  • Введите текст в текущей позиции курсора.
  • Делайте снимки экрана всего экрана или отдельных окон с возможностью сохранения в каталоге загрузок.
  • Извлечение текста из снимков экрана с помощью OCR (оптического распознавания символов)
  • Список и активация окон
  • Нажмите клавиши клавиатуры
  • Операции перетаскивания

Доступные инструменты

Управление мышью

  • click_screen(x: int, y: int) : Щелкните по указанным координатам экрана
  • move_mouse(x: int, y: int) : переместить курсор мыши в указанные координаты
  • drag_mouse(from_x: int, from_y: int, to_x: int, to_y: int, duration: float = 0.5) : перетаскивание мыши из одной позиции в другую

Управление с клавиатуры

  • type_text(text: str) : Введите указанный текст в текущей позиции курсора
  • press_key(key: str) : нажать указанную клавишу клавиатуры

Управление экраном и окном

  • take_screenshot(title_pattern: str = None, use_regex: bool = False, threshold: int = 60, with_ocr_text_and_coords: bool = False, scale_percent_for_ocr: int = 100, save_to_downloads: bool = False) : захват экрана или окна с возможностью распознавания текста
  • get_screen_size() : Получить текущее разрешение экрана
  • list_windows() : Список всех открытых окон
  • activate_window(title_pattern: str, use_regex: bool = False, threshold: int = 60) : вывести указанное окно на передний план

Разработка

Настройка среды разработки

# Clone the repository git clone https://github.com/AB498/computer-control-mcp.git cd computer-control-mcp # Install in development mode pip install -e . # Start server python -m computer_control_mcp.core

Проведение тестов

python -m pytest

Ссылка на API

Подробную информацию о доступных функциях и классах см. в справочнике API.

Лицензия

Массачусетский технологический институт

Для получения дополнительной информации или помощи

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Сервер MCP, который обеспечивает возможности управления компьютером, включая движения мыши, действия с клавиатурой, захват снимков экрана с помощью OCR и управление окнами через унифицированный API.

  1. MCP-сервер, который обеспечивает возможности управления компьютером, такие как мышь, клавиатура, OCR и т. д. с использованием PyAutoGUI, RapidOCR, ONNXRuntime. Аналогично 'computer-use' от Anthropic. С нулевыми внешними зависимостями.
    1. Быстрое использование (настройка MCP с использованием uvx )
      1. Функции
        1. Доступные инструменты
          1. Управление мышью
          2. Управление с клавиатуры
          3. Управление экраном и окном
        2. Разработка
          1. Настройка среды разработки
          2. Проведение тестов
        3. Ссылка на API
          1. Лицензия
            1. Для получения дополнительной информации или помощи

              Related MCP Servers

              • -
                security
                A
                license
                -
                quality
                A Windows control server built using nut.js and Model Context Protocol (MCP), providing programmatic control over Windows system operations including mouse, keyboard, window management, and screen capture functionality.
                Last updated -
                79
                137
                TypeScript
                MIT License
              • -
                security
                A
                license
                -
                quality
                A MCP server that provides browser automation tools, allowing users to navigate websites, take screenshots, click elements, fill forms, and execute JavaScript through Playwright.
                Last updated -
                Python
                Apache 2.0
                • Apple
              • -
                security
                A
                license
                -
                quality
                An MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.
                Last updated -
                Python
                MIT License
                • Apple
                • Linux
              • -
                security
                A
                license
                -
                quality
                Provides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.
                Last updated -
                6
                Python
                MIT License
                • Apple
                • Linux

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/AB498/computer-control-mcp'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server