Skip to main content
Glama

Windows-MCP

by CursorTouch

Windows MCP es un proyecto ligero y de código abierto que permite una integración fluida entre los agentes de IA y el sistema operativo Windows. Al actuar como servidor MCP, se crea un puente entre los LLM y el sistema operativo Windows, permitiendo a los agentes realizar tareas como la navegación de archivos, el control de aplicaciones, la interacción con la interfaz de usuario, las pruebas de control de calidad y mucho más.

https://github.com/user-attachments/assets/d0e7ed1d-6189-4de6-838a-5ef8e1cad54e

✨ Características principales

  • Integración perfecta con Windows
    Interactúa de forma nativa con los elementos de la interfaz de usuario de Windows, abre aplicaciones, controla ventanas, simula la entrada del usuario y más.

  • Utilice cualquier LLM (Visión opcional) A diferencia de muchas herramientas de automatización, Windows MCP no depende de ninguna técnica de visión artificial tradicional ni de modelos específicos ajustados; funciona con cualquier LLM, lo que reduce la complejidad y el tiempo de configuración.

  • Conjunto de herramientas enriquecido para la automatización de la interfaz de usuario
    Incluye herramientas para el funcionamiento básico del teclado y el mouse, y para capturar el estado de la ventana/IU.

  • Ligero y de código abierto
    Dependencias mínimas y fácil configuración con código fuente completo disponible bajo licencia MIT.

  • Personalizable y extensible
    Adapte o amplíe fácilmente las herramientas para satisfacer sus necesidades únicas de automatización o integración de IA.

  • Interacción en tiempo real
    La latencia típica entre acciones (por ejemplo, de un clic del mouse al siguiente) varía de 4 a 8 segundos y puede variar levemente según la cantidad de aplicaciones activas y la carga del sistema.

Sistemas operativos compatibles

  • Ventanas 10

  • Windows 11

Instalación

Prerrequisitos

  • Python 3.12+

  • Aplicación de escritorio Anthropic Claude u otros clientes MCP

  • UV (administrador de paquetes de Python), instalar con pip install uv

🏁 Primeros pasos

  1. Clonar el repositorio.

git clone https://github.com/CursorTouch/Windows-MCP.git cd Windows-MCP
  1. Instalar dependencias:

uv pip install -r pyproject.toml
  1. Conectarse al servidor MCP

Copie el siguiente JSON con los valores {{PATH}} apropiados:

{ "mcpServers": { "windows-mcp": { "command": "{{PATH_TO_UV}}", "args": [ "--directory", "{{PATH_TO_SRC}}/Windows-MCP", "run", "server.py" ] } } }

Para Claude, guarde esto como claude_desktop_config.json en su directorio de configuración de Claude Desktop en:

%APPDATA%/Claude/claude_desktop_config.json
  1. Reiniciar Claude Desktop

Abra Claude Desktop y ahora debería ver Windows-MCP como una integración disponible.

Para obtener más información sobre la solución de problemas de integración con Claude Desktop, consulte la documentación de MCP . Esta documentación incluye consejos útiles para revisar los registros y resolver problemas comunes.


Herramientas MCP

Claude puede acceder a las siguientes herramientas para interactuar con Windows:

  • Click-Tool : haga clic en la pantalla en las coordenadas indicadas.

  • Type-Tool : escribe texto en un elemento (opcionalmente borra el texto existente).

  • Clipboard-Tool : Copie o pegue usando el portapapeles del sistema.

  • Scroll-Tool : desplazarse hacia arriba o hacia abajo.

  • Drag-Tool : Arrastre de un punto a otro.

  • Move-Tool : Mover el puntero del mouse.

  • Shortcut-Tool : presione los atajos del teclado ( Ctrl+c , Alt+Tab , etc.).

  • Key-Tool : presione una sola tecla.

  • Wait-Tool : Pausa por una duración definida.

  • State-Tool : instantánea combinada de aplicaciones activas y elementos de interfaz de usuario interactivos.

  • Screenshot-Tool : captura una captura de pantalla del escritorio.

  • Launch-Tool : para iniciar una aplicación desde el menú de inicio.

  • Shell-Tool : Para ejecutar comandos de PowerShell.

⚠️Precaución

Este MCP interactúa directamente con su sistema operativo Windows para realizar acciones. Úselo con precaución y evite implementarlo en entornos donde no se puedan tolerar tales riesgos.

🪪Licencia

Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.

🤝Contribuyendo

¡Agradecemos sus contribuciones! Consulte la sección "CONTRIBUYENDO" para obtener instrucciones de configuración y desarrollo.

Hecho con ❤️ por Jeomon George

Citación

@misc{ author = {George, Jeomon}, title = {Windows-MCP}, year = {2024}, publisher = {GitHub}, howpublished = {\url{https://github.com/Jeomon/Windows-MCP}}, note = {Lightweight open-source project for integrating LLM agents with Windows} }
-
security - not tested
-
license - not tested
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Un servidor liviano que permite a los agentes de IA interactuar con el sistema operativo Windows, lo que permite la navegación de archivos, el control de aplicaciones, la interacción de la interfaz de usuario y las pruebas de control de calidad a través de varias herramientas.

  1. Sistemas operativos compatibles
    1. Instalación
      1. Prerrequisitos
    2. 🏁 Primeros pasos
      1. Herramientas MCP
        1. ⚠️Precaución
          1. 🪪Licencia
            1. 🤝Contribuyendo
              1. Citación

                Related MCP Servers

                • -
                  security
                  -
                  license
                  -
                  quality
                  A server that allows AI models to automate Microsoft Office applications (Word, Excel, PowerPoint, etc.) through COM interface on Windows, enabling natural language control of Office functions.
                  Last updated -
                  26
                • -
                  security
                  -
                  license
                  -
                  quality
                  A lightweight open-source server that enables AI agents to interact with the Windows operating system, allowing for file navigation, application control, UI interaction, and QA testing without requiring computer vision.
                  Last updated -
                  3,328
                  MIT License
                • -
                  security
                  -
                  license
                  -
                  quality
                  A server that enables AI assistants to control a browser through tools, allowing them to perform web automation tasks like navigation, typing, clicking, and taking screenshots.
                  Last updated -
                • A
                  security
                  -
                  license
                  A
                  quality
                  A comprehensive Model Context Protocol server that enables AI assistants to interact with and manage Windows systems, providing capabilities for file system operations, process management, system information retrieval, registry operations, service management, network diagnostics, and performance monitoring.
                  Last updated -
                  7
                  2

                View all related MCP servers

                MCP directory API

                We provide all the information about MCP servers via our MCP API.

                curl -X GET 'https://glama.ai/api/mcp/v1/servers/CursorTouch/Windows-MCP'

                If you have feedback or need assistance with the MCP directory API, please join our Discord server