Windows-MCP

by CursorTouch

Windows MCP es un proyecto ligero y de código abierto que permite una integración fluida entre los agentes de IA y el sistema operativo Windows. Al actuar como servidor MCP, se crea un puente entre los LLM y el sistema operativo Windows, permitiendo a los agentes realizar tareas como la navegación de archivos, el control de aplicaciones, la interacción con la interfaz de usuario, las pruebas de control de calidad y mucho más.

https://github.com/user-attachments/assets/d0e7ed1d-6189-4de6-838a-5ef8e1cad54e

✨ Características principales

  • Integración perfecta con Windows
    Interactúa de forma nativa con los elementos de la interfaz de usuario de Windows, abre aplicaciones, controla ventanas, simula la entrada del usuario y más.
  • Utilice cualquier LLM (Visión opcional) A diferencia de muchas herramientas de automatización, Windows MCP no depende de ninguna técnica de visión artificial tradicional ni de modelos específicos ajustados; funciona con cualquier LLM, lo que reduce la complejidad y el tiempo de configuración.
  • Conjunto de herramientas enriquecido para la automatización de la interfaz de usuario
    Incluye herramientas para el funcionamiento básico del teclado y el mouse, y para capturar el estado de la ventana/IU.
  • Ligero y de código abierto
    Dependencias mínimas y fácil configuración con código fuente completo disponible bajo licencia MIT.
  • Personalizable y extensible
    Adapte o amplíe fácilmente las herramientas para satisfacer sus necesidades únicas de automatización o integración de IA.
  • Interacción en tiempo real
    La latencia típica entre acciones (por ejemplo, de un clic del mouse al siguiente) varía de 4 a 8 segundos y puede variar levemente según la cantidad de aplicaciones activas y la carga del sistema.

Sistemas operativos compatibles

  • Ventanas 10
  • Windows 11

Instalación

Prerrequisitos

  • Python 3.12+
  • Aplicación de escritorio Anthropic Claude u otros clientes MCP
  • UV (administrador de paquetes de Python), instalar con pip install uv

🏁 Primeros pasos

  1. Clonar el repositorio.
git clone https://github.com/CursorTouch/Windows-MCP.git cd Windows-MCP
  1. Instalar dependencias:
uv pip install -r pyproject.toml
  1. Conectarse al servidor MCP

Copie el siguiente JSON con los valores {{PATH}} apropiados:

{ "mcpServers": { "windows-mcp": { "command": "{{PATH_TO_UV}}", "args": [ "--directory", "{{PATH_TO_SRC}}/Windows-MCP", "run", "server.py" ] } } }

Para Claude, guarde esto como claude_desktop_config.json en su directorio de configuración de Claude Desktop en:

%APPDATA%/Claude/claude_desktop_config.json
  1. Reiniciar Claude Desktop

Abra Claude Desktop y ahora debería ver Windows-MCP como una integración disponible.

Para obtener más información sobre la solución de problemas de integración con Claude Desktop, consulte la documentación de MCP . Esta documentación incluye consejos útiles para revisar los registros y resolver problemas comunes.


Herramientas MCP

Claude puede acceder a las siguientes herramientas para interactuar con Windows:

  • Click-Tool : haga clic en la pantalla en las coordenadas indicadas.
  • Type-Tool : escribe texto en un elemento (opcionalmente borra el texto existente).
  • Clipboard-Tool : Copie o pegue usando el portapapeles del sistema.
  • Scroll-Tool : desplazarse hacia arriba o hacia abajo.
  • Drag-Tool : Arrastre de un punto a otro.
  • Move-Tool : Mover el puntero del mouse.
  • Shortcut-Tool : presione los atajos del teclado ( Ctrl+c , Alt+Tab , etc.).
  • Key-Tool : presione una sola tecla.
  • Wait-Tool : Pausa por una duración definida.
  • State-Tool : instantánea combinada de aplicaciones activas y elementos de interfaz de usuario interactivos.
  • Screenshot-Tool : captura una captura de pantalla del escritorio.
  • Launch-Tool : para iniciar una aplicación desde el menú de inicio.
  • Shell-Tool : Para ejecutar comandos de PowerShell.

⚠️Precaución

Este MCP interactúa directamente con su sistema operativo Windows para realizar acciones. Úselo con precaución y evite implementarlo en entornos donde no se puedan tolerar tales riesgos.

🪪Licencia

Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.

🤝Contribuyendo

¡Agradecemos sus contribuciones! Consulte la sección "CONTRIBUYENDO" para obtener instrucciones de configuración y desarrollo.

Hecho con ❤️ por Jeomon George

Citación

@misc{ author = {George, Jeomon}, title = {Windows-MCP}, year = {2024}, publisher = {GitHub}, howpublished = {\url{https://github.com/Jeomon/Windows-MCP}}, note = {Lightweight open-source project for integrating LLM agents with Windows} }
-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Un servidor liviano que permite a los agentes de IA interactuar con el sistema operativo Windows, lo que permite la navegación de archivos, el control de aplicaciones, la interacción de la interfaz de usuario y las pruebas de control de calidad a través de varias herramientas.

  1. Sistemas operativos compatibles
    1. Instalación
      1. Prerrequisitos
    2. 🏁 Primeros pasos
      1. Herramientas MCP
        1. ⚠️Precaución
          1. 🪪Licencia
            1. 🤝Contribuyendo
              1. Citación

                Related MCP Servers

                • A
                  security
                  A
                  license
                  A
                  quality
                  A Model Context Protocol server that enables AI clients to interact with virtual Ubuntu desktops, allowing them to browse the web, run code, and control instances through mouse/keyboard actions and bash commands.
                  Last updated -
                  5
                  9
                  JavaScript
                  MIT License
                • -
                  security
                  A
                  license
                  -
                  quality
                  A Model Context Protocol server that enables AI agents to interact with ClickUp workspaces, allowing task creation, management, and workspace organization through natural language commands.
                  Last updated -
                  255
                  MIT License
                • -
                  security
                  F
                  license
                  -
                  quality
                  A server that enables AI systems to browse, retrieve content from, and interact with web pages through the Model Context Protocol.
                  Last updated -
                • -
                  security
                  F
                  license
                  -
                  quality
                  A lightweight server that enables AI assistants like Cursor & Claude to read from and write to Obsidian vaults, allowing actions like creating notes, checking existing content, and managing todos through natural language.
                  Last updated -
                  192
                  8
                  TypeScript

                View all related MCP servers

                ID: g8lizqmcdh