Integrations
Offers a community support channel through Discord for users to get help with the MCP server.
Hosts the project repository on GitHub where users can access code, documentation, and demonstration resources.
Uses ONNXRuntime for efficient machine learning model execution to power OCR capabilities in the MCP server.
Компьютерное управление MCP
MCP-сервер, который обеспечивает возможности управления компьютером, такие как мышь, клавиатура, OCR и т. д. с использованием PyAutoGUI, RapidOCR, ONNXRuntime. Аналогично 'computer-use' от Anthropic. С нулевыми внешними зависимостями.
- Протестировано только на Windows. Должно работать на других платформах.
Быстрое использование (настройка MCP с использованием uvx
)
Примечание: запуск uvx computer-control-mcp@latest
в первый раз загрузит зависимости python (около 70 МБ), что может занять некоторое время. Рекомендуется запустить это в терминале перед использованием его в качестве MCP. Последующие запуски будут мгновенными.
ИЛИ установите глобально с помощью pip
:
Затем запустите сервер с помощью:
Функции
- Управление движениями и щелчками мыши
- Введите текст в текущей позиции курсора.
- Делайте снимки экрана всего экрана или отдельных окон с возможностью сохранения в каталоге загрузок.
- Извлечение текста из снимков экрана с помощью OCR (оптического распознавания символов)
- Список и активация окон
- Нажмите клавиши клавиатуры
- Операции перетаскивания
Доступные инструменты
Управление мышью
click_screen(x: int, y: int)
: Щелкните по указанным координатам экранаmove_mouse(x: int, y: int)
: переместить курсор мыши в указанные координатыdrag_mouse(from_x: int, from_y: int, to_x: int, to_y: int, duration: float = 0.5)
: перетаскивание мыши из одной позиции в другую
Управление с клавиатуры
type_text(text: str)
: Введите указанный текст в текущей позиции курсораpress_key(key: str)
: нажать указанную клавишу клавиатуры
Управление экраном и окном
take_screenshot(title_pattern: str = None, use_regex: bool = False, threshold: int = 60, with_ocr_text_and_coords: bool = False, scale_percent_for_ocr: int = 100, save_to_downloads: bool = False)
: захват экрана или окна с возможностью распознавания текстаget_screen_size()
: Получить текущее разрешение экранаlist_windows()
: Список всех открытых оконactivate_window(title_pattern: str, use_regex: bool = False, threshold: int = 60)
: вывести указанное окно на передний план
Разработка
Настройка среды разработки
Проведение тестов
Ссылка на API
Подробную информацию о доступных функциях и классах см. в справочнике API.
Лицензия
Массачусетский технологический институт
Для получения дополнительной информации или помощи
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Сервер MCP, который обеспечивает возможности управления компьютером, включая движения мыши, действия с клавиатурой, захват снимков экрана с помощью OCR и управление окнами через унифицированный API.
- MCP-сервер, который обеспечивает возможности управления компьютером, такие как мышь, клавиатура, OCR и т. д. с использованием PyAutoGUI, RapidOCR, ONNXRuntime. Аналогично 'computer-use' от Anthropic. С нулевыми внешними зависимостями.
- Быстрое использование (настройка MCP с использованием uvx )
- Функции
- Доступные инструменты
- Разработка
- Ссылка на API
- Лицензия
- Для получения дополнительной информации или помощи
Related MCP Servers
- -securityAlicense-qualityA Windows control server built using nut.js and Model Context Protocol (MCP), providing programmatic control over Windows system operations including mouse, keyboard, window management, and screen capture functionality.Last updated -13784TypeScriptMIT License
- -securityAlicense-qualityA MCP server that provides browser automation tools, allowing users to navigate websites, take screenshots, click elements, fill forms, and execute JavaScript through Playwright.Last updated -PythonApache 2.0
- -securityAlicense-qualityAn MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.Last updated -PythonMIT License
- -securityAlicense-qualityProvides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.Last updated -6PythonMIT License