mcp-test-utils
MCP Test Utils
100% Código de IA · Revisado por humanos
Servidor MCP para pruebas automatizadas de interfaz de usuario de escritorio. Un binario único: sin tiempo de ejecución, sin dependencias, sin instalación.
Solo Windows x64. El soporte para macOS y Linux está planificado.
Proporciona a los agentes de IA ojos y manos: capturas de pantalla, gestión de ventanas, ratón, teclado, automatización de UI, OCR, búsqueda de archivos.
Por qué
Los agentes de IA pueden activar acciones en aplicaciones pero no pueden ver la pantalla. Este servidor cierra esa brecha:
Agent triggers action → takes screenshot → sees the result →
switches window → clicks a button → verifies → writes reportTotalmente autónomo, no requiere intervención del usuario.
Demo
10 tareas. Una sola toma. Ver en YouTube →

MCP Test Utils vs Anthropic Computer Use
Claude Cowork ahora incluye Computer Use integrado: Claude toma capturas de pantalla y hace clic en las interfaces visualmente. Funciona sin configuración. MCP Test Utils adopta un enfoque diferente: en lugar de adivinar dónde hacer clic a partir de una captura de pantalla, lee la estructura real de la interfaz de usuario a través de las API de Windows.
MCP Test Utils | Computer Use | |
Precisión de clic | Exacta — API de automatización de UI | Estimación visual desde captura de pantalla |
Velocidad y coste de tokens | Rápido, bajo coste — respuestas de texto | Más lento, costoso — imagen en cada paso |
Estructura de UI | Árbol completo: roles, estados, coordenadas | No disponible |
OCR | Coordenadas a nivel de palabra, multi-idioma | No disponible (solo visión del modelo) |
Gestión de ventanas | Basada en API, coordenadas relativas a la ventana | Navegación visual |
Búsqueda de archivos | Motor Ripgrep integrado | No disponible |
Registro de sesión | JSONL + capturas de pantalla | No disponible |
Análisis visual | ✅ Mismo modelo Claude, resolución completa 1:1 | ✅ Mismo modelo Claude |
Configuración | Descargar binario, añadir a la configuración | Integrado, un solo interruptor |
Móvil / Dispatch | — | ✅ Tareas desde el teléfono |
Multiplataforma | Windows (macOS/Linux planificado) | macOS + Windows |
MCP Test Utils es más rápido, más preciso y más barato por acción. Computer Use es más fácil de empezar y funciona en todas las plataformas. Se complementan entre sí.
Plataformas
Plataforma | Estado |
Windows x64 | ✅ Soporte completo |
macOS arm64 | ⏳ Planificado |
Linux x64 | ⏳ Planificado |
Herramientas (19)
Visión
Herramienta | Descripción |
| Captura de pantalla de todo el escritorio con calidad configurable |
| Captura de pantalla de una ventana específica (modo de captura de pantalla o ventana) |
| OCR de toda la pantalla (Windows.Media.Ocr) |
| OCR de una región de la pantalla con coordenadas precisas de palabras |
Gestión de ventanas
Herramienta | Descripción |
| Lista de ventanas con id, título, aplicación, posición, tamaño, minimizada, enfocada |
| Traer una ventana al frente, restaurar si está minimizada |
Entrada
Herramienta | Descripción |
| Clic (izquierdo / derecho / central) en coordenadas de pantalla o relativas a la ventana |
| Mover el cursor a un punto |
| Arrastrar desde el punto A al punto B |
| Desplazar la rueda del ratón |
| Escribir texto (Unicode completo — latín, cirílico, CJK, emoji) |
| Presionar una tecla (Enter, Tab, F1–F12, flechas, etc.) |
| Combinaciones de teclas (Ctrl+S, Alt+F4, Ctrl+Shift+P, etc.) |
Acceso estructurado a la UI
Herramienta | Descripción |
| Árbol de automatización de UI — botones, campos, menús con coordenadas exactas |
Búsqueda de archivos
Herramienta | Descripción |
| Buscar texto o regex en archivos dentro de directorios permitidos (como Buscar en archivos de VS Code) |
| Encontrar archivos y directorios por patrón de nombre (glob), como "Ir al archivo" |
Guía del agente
Herramienta | Descripción |
| Guía de flujo de trabajo compacta para agentes LLM — clics de precisión, metadatos de coordenadas, consejos de calidad |
Registro de sesión
Herramienta | Descripción |
| Iniciar el registro de llamadas a herramientas en JSONL + capturas de pantalla (opcional) |
| Detener el registro, obtener estadísticas de la sesión |
Instalación
Descarga el binario desde Releases.
Añádelo a la configuración de tu cliente MCP. El ejemplo a continuación es para Claude Desktop; para otros clientes, consulta su documentación.
Claude Desktop: %APPDATA%\Claude\claude_desktop_config.json
{
"mcpServers": {
"test-utils": {
"command": "D:\\path\\to\\mcp-test-utils.exe"
}
}
}Reinicia Claude Desktop.
En el chat, prueba: "Take a screenshot" — el agente devolverá una imagen de tu escritorio.
Con registro y búsqueda de archivos (opcional)
{
"mcpServers": {
"test-utils": {
"command": "D:\\path\\to\\mcp-test-utils.exe",
"env": {
"MCP_LOG_DIR": "D:\\path\\to\\logs",
"MCP_LOG_MAX_MB": "500",
"MCP_LOG_RETAIN_DAYS": "30",
"MCP_SEARCH_DIRS": "D:\\Projects\\app1;D:\\Projects\\app2"
}
}
}
}Ajustes preestablecidos de calidad
Las capturas de pantalla admiten una calidad configurable para equilibrar el detalle y el coste de tokens:
Ajuste preestablecido | Escala | Formato | Caso de uso |
| 100% | JPEG q90 | Máximo detalle |
| 50% | JPEG q70 | Equilibrado (predeterminado) |
| 50% | PNG | Cuando se necesita PNG |
| 25% | Escala de grises | Menor coste de tokens |
| 10–100% | JPEG / PNG / Escala de grises | Control total |
Variables de entorno
Variable | Descripción | Predeterminado |
| Ruta para las sesiones de registro. Sin ella, las herramientas de registro están ocultas | — |
| Límite de tamaño de sesión (aviso al exceder) |
|
| Eliminar automáticamente sesiones con más de N días. |
|
| Directorios permitidos para | — |
Cómo funciona
MCP Test Utils es un servidor JSON-RPC 2.0 que se comunica a través de stdin/stdout. Cualquier cliente compatible con MCP inicia el binario, envía llamadas a herramientas y recibe respuestas estructuradas (texto, imágenes en base64). Probado con Claude Desktop.
El servidor utiliza las API nativas de Windows directamente: Win32 GDI para capturas de pantalla, SendInput para ratón y teclado, API COM de automatización de UI para inspección de elementos, Windows.Media.Ocr de WinRT para reconocimiento de texto. La búsqueda de archivos utiliza el motor ripgrep (grep-regex, grep-searcher, ignore) — multiplataforma, sin dependencias externas. Sin PowerShell, sin herramientas externas, sin acceso a la red.
Casos de uso
QA automatizado — el agente navega por la aplicación, hace clic en los flujos, toma capturas de pantalla en cada paso, escribe un informe de prueba
Automatización de escritorio — rellenar formularios, copiar datos entre ventanas, ejecutar flujos de trabajo
Auditoría de accesibilidad — escanear el árbol de automatización de UI en busca de etiquetas o roles faltantes
Regresión visual — comparación de capturas de pantalla entre versiones
Extracción de datos — OCR de texto de aplicaciones que no exponen API
Búsqueda de código — encontrar patrones en múltiples proyectos sin salir de la sesión del agente
Seguridad
Responde solo a solicitudes del cliente MCP
No abre puertos de red
No escribe nada en el disco (excepto el registro opcional)
No envía datos externamente
Las capturas de pantalla capturan toda la pantalla — asegúrate de que no haya información confidencial visible
La búsqueda de archivos está aislada (sandboxed) — solo los directorios en
MCP_SEARCH_DIRSson accesibles
Apóyanos
Gratis y sin restricciones. Si te resulta útil — jeenyjai.github.io
Licencia
Copyright 2026 JeenyJAI. Todos los derechos reservados.
🚀 Creado con Claude
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/JeenyJAI/mcp-test-utils'
If you have feedback or need assistance with the MCP directory API, please join our Discord server