Integrations
Offers a community support channel through Discord for users to get help with the MCP server.
Hosts the project repository on GitHub where users can access code, documentation, and demonstration resources.
Uses ONNXRuntime for efficient machine learning model execution to power OCR capabilities in the MCP server.
Control por computadora MCP
Servidor MCP que proporciona funciones de control de computadora, como ratón, teclado, OCR, etc., mediante PyAutoGUI, RapidOCR y ONNXRuntime. Similar a "computer-use" de Anthropic. Sin dependencias externas.
- Probado solo en Windows. Debería funcionar en otras plataformas.
Uso rápido (Configuración de MCP con uvx
)
O instalar globalmente con pip
:
Luego ejecute el servidor con:
Características
- Controlar los movimientos y clics del ratón
- Escriba texto en la posición actual del cursor
- Tome capturas de pantalla de toda la pantalla o de ventanas específicas con opción de guardarlas en el directorio de descargas
- Extraer texto de capturas de pantalla mediante OCR (reconocimiento óptico de caracteres)
- Listar y activar ventanas
- Presione las teclas del teclado
- Operaciones de arrastrar y soltar
Herramientas disponibles
Control del ratón
click_screen(x: int, y: int)
: Haga clic en las coordenadas de pantalla especificadasmove_mouse(x: int, y: int)
: Mueve el cursor del mouse a las coordenadas especificadasdrag_mouse(from_x: int, from_y: int, to_x: int, to_y: int, duration: float = 0.5)
: Arrastre el mouse de una posición a otra
Control del teclado
type_text(text: str)
: Escribe el texto especificado en la posición actual del cursorpress_key(key: str)
: Presione una tecla del teclado especificada
Gestión de pantallas y ventanas
take_screenshot(title_pattern: str = None, use_regex: bool = False, threshold: int = 60, with_ocr_text_and_coords: bool = False, scale_percent_for_ocr: int = 100, save_to_downloads: bool = False)
: Capturar pantalla o ventana con OCR opcionalget_screen_size()
: Obtener la resolución de pantalla actuallist_windows()
: enumera todas las ventanas abiertasactivate_window(title_pattern: str, use_regex: bool = False, threshold: int = 60)
: Trae la ventana especificada al primer plano
Desarrollo
Configuración del entorno de desarrollo
Ejecución de pruebas
Referencia de API
Consulte la Referencia de API para obtener información detallada sobre las funciones y clases disponibles.
Licencia
Instituto Tecnológico de Massachusetts (MIT)
Para obtener más información o ayuda
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Servidor MCP que proporciona capacidades de control de computadora, incluidos movimientos del mouse, acciones del teclado, captura de captura de pantalla con OCR y administración de ventanas a través de una API unificada.
- Servidor MCP que proporciona funciones de control de computadora, como ratón, teclado, OCR, etc., mediante PyAutoGUI, RapidOCR y ONNXRuntime. Similar a "computer-use" de Anthropic. Sin dependencias externas.
- Uso rápido (Configuración de MCP con uvx )
- Características
- Herramientas disponibles
- Desarrollo
- Referencia de API
- Licencia
- Para obtener más información o ayuda
Related MCP Servers
- -securityAlicense-qualityA Windows control server built using nut.js and Model Context Protocol (MCP), providing programmatic control over Windows system operations including mouse, keyboard, window management, and screen capture functionality.Last updated -13784TypeScriptMIT License
- -securityAlicense-qualityA MCP server that provides browser automation tools, allowing users to navigate websites, take screenshots, click elements, fill forms, and execute JavaScript through Playwright.Last updated -PythonApache 2.0
- -securityAlicense-qualityAn MCP server that bridges AI agents with GUI automation capabilities, allowing them to control mouse, keyboard, windows, and take screenshots to interact with desktop applications.Last updated -PythonMIT License
- -securityAlicense-qualityProvides automated GUI testing and control capabilities through an MCP server that enables mouse movements, keyboard input, screen captures, and image recognition across Windows, macOS, and Linux.Last updated -6PythonMIT License