Control por computadora MCP
Servidor MCP que proporciona funciones de control de computadora, como ratón, teclado, OCR, etc., mediante PyAutoGUI, RapidOCR y ONNXRuntime. Similar a "computer-use" de Anthropic. Sin dependencias externas.
Probado solo en Windows. Debería funcionar en otras plataformas.

Uso rápido (Configuración de MCP con uvx )
O instalar globalmente con pip :
Luego ejecute el servidor con:
Related MCP server: PyAutoGUI MCP Server
Características
Controlar los movimientos y clics del ratón
Escriba texto en la posición actual del cursor
Tome capturas de pantalla de toda la pantalla o de ventanas específicas con opción de guardarlas en el directorio de descargas
Extraer texto de capturas de pantalla mediante OCR (reconocimiento óptico de caracteres)
Listar y activar ventanas
Presione las teclas del teclado
Operaciones de arrastrar y soltar
Herramientas disponibles
Control del ratón
click_screen(x: int, y: int): Haga clic en las coordenadas de pantalla especificadasmove_mouse(x: int, y: int): Mueve el cursor del mouse a las coordenadas especificadasdrag_mouse(from_x: int, from_y: int, to_x: int, to_y: int, duration: float = 0.5): Arrastre el mouse de una posición a otra
Control del teclado
type_text(text: str): Escribe el texto especificado en la posición actual del cursorpress_key(key: str): Presione una tecla del teclado especificada
Gestión de pantallas y ventanas
take_screenshot(title_pattern: str = None, use_regex: bool = False, threshold: int = 60, with_ocr_text_and_coords: bool = False, scale_percent_for_ocr: int = 100, save_to_downloads: bool = False): Capturar pantalla o ventana con OCR opcionalget_screen_size(): Obtener la resolución de pantalla actuallist_windows(): enumera todas las ventanas abiertasactivate_window(title_pattern: str, use_regex: bool = False, threshold: int = 60): Trae la ventana especificada al primer plano
Desarrollo
Configuración del entorno de desarrollo
Ejecución de pruebas
Referencia de API
Consulte la Referencia de API para obtener información detallada sobre las funciones y clases disponibles.
Licencia
Instituto Tecnológico de Massachusetts (MIT)