Skip to main content
Glama

MCP Test Utils

100% KI-Code · Von Menschen geprüft

version: 3.10.1 tools: 19 AI generated: 100%

MCP-Server für automatisierte Desktop-UI-Tests. Eine einzelne Binärdatei — keine Laufzeitumgebung, keine Abhängigkeiten, keine Installation.

Nur Windows x64. Unterstützung für macOS und Linux ist geplant.

Verleiht KI-Agenten Augen und Hände: Screenshots, Fensterverwaltung, Maus, Tastatur, UI-Automatisierung, OCR, Dateisuche.

Warum

KI-Agenten können Aktionen in Anwendungen auslösen, aber den Bildschirm nicht sehen. Dieser Server schließt diese Lücke:

Agent triggers action → takes screenshot → sees the result →
switches window → clicks a button → verifies → writes report

Vollständig autonom, kein Benutzereingriff erforderlich.

Demo

10 Aufgaben. Ein Durchgang. Auf YouTube ansehen →

MCP Test Utils — Vollständige Demo

MCP Test Utils vs. Anthropic Computer Use

Claude Cowork enthält jetzt integrierte Computer Use — Claude macht Screenshots und klickt sich visuell durch Oberflächen. Es funktioniert ohne Einrichtung. MCP Test Utils verfolgt einen anderen Ansatz: Anstatt aus einem Screenshot zu erraten, wo geklickt werden soll, liest es die tatsächliche UI-Struktur über Windows-APIs aus.

MCP Test Utils

Computer Use

Klickpräzision

Exakt — UI Automation API

Visuelle Schätzung aus Screenshot

Geschwindigkeit & Token-Kosten

Schnell, kostengünstig — Textantworten

Langsamer, teurer — Bild bei jedem Schritt

UI-Struktur

Vollständiger Baum: Rollen, Zustände, Koordinaten

Nicht verfügbar

OCR

Wortgenaue Koordinaten, mehrsprachig

Nicht verfügbar (nur Modell-Vision)

Fensterverwaltung

API-basiert, fensterrelative Koordinaten

Visuelle Navigation

Dateisuche

Ripgrep-Engine integriert

Nicht verfügbar

Sitzungsprotokollierung

JSONL + Screenshots

Nicht verfügbar

Visuelle Analyse

✅ Dasselbe Claude-Modell, volle Auflösung 1:1

✅ Dasselbe Claude-Modell

Einrichtung

Binärdatei herunterladen, zur Konfiguration hinzufügen

Integriert, ein Schalter

Mobil / Dispatch

✅ Aufgaben vom Telefon

Plattformübergreifend

Windows (macOS/Linux geplant)

macOS + Windows

MCP Test Utils ist schneller, präziser und pro Aktion günstiger. Computer Use ist einfacher zu starten und funktioniert plattformübergreifend. Sie ergänzen sich gegenseitig.

Plattformen

Plattform

Status

Windows x64

✅ Volle Unterstützung

macOS arm64

⏳ Geplant

Linux x64

⏳ Geplant

Tools (19)

Vision

Tool

Beschreibung

take_screenshot

Screenshot des gesamten Desktops mit konfigurierbarer Qualität

take_window_screenshot

Screenshot eines bestimmten Fensters (Bildschirm- oder Fensteraufnahmemodus)

read_screen_text

OCR des gesamten Bildschirms (Windows.Media.Ocr)

read_region_text

OCR eines Bildschirmbereichs mit präzisen Wortkoordinaten

Fensterverwaltung

Tool

Beschreibung

list_windows

Auflistung der Fenster mit ID, Titel, App, Position, Größe, minimiert, fokussiert

focus_window

Fenster in den Vordergrund bringen, wiederherstellen, falls minimiert

Eingabe

Tool

Beschreibung

mouse_click

Klicken (links / rechts / mitte) an bildschirm- oder fensterrelativen Koordinaten

mouse_move

Cursor zu einem Punkt bewegen

mouse_drag

Von Punkt A nach Punkt B ziehen

mouse_scroll

Mausrad scrollen

keyboard_type

Text eingeben (vollständiges Unicode — Lateinisch, Kyrillisch, CJK, Emoji)

keyboard_press

Taste drücken (Enter, Tab, F1–F12, Pfeile usw.)

keyboard_shortcut

Tastenkombinationen (Strg+S, Alt+F4, Strg+Umschalt+P usw.)

Strukturierter UI-Zugriff

Tool

Beschreibung

list_ui_elements

UI-Automatisierungsbaum — Schaltflächen, Felder, Menüs mit exakten Koordinaten

Dateisuche

Tool

Beschreibung

search_in_files

Suche nach Text oder Regex in Dateien innerhalb erlaubter Verzeichnisse (wie VS Code „In Dateien suchen“)

find_files

Dateien und Verzeichnisse nach Namensmuster (Glob) finden, wie „Gehe zu Datei“

Agenten-Leitfaden

Tool

Beschreibung

get_usage_guide

Kompakter Workflow-Leitfaden für LLM-Agenten — präzises Klicken, Koordinaten-Metadaten, Qualitätstipps

Sitzungsprotokollierung

Tool

Beschreibung

enable_logging

Aufzeichnung von Tool-Aufrufen in JSONL + Screenshots starten (Opt-in)

disable_logging

Aufzeichnung stoppen, Sitzungsstatistiken abrufen

Installation

  1. Laden Sie die Binärdatei von Releases herunter.

  2. Fügen Sie sie Ihrer MCP-Client-Konfiguration hinzu. Das folgende Beispiel gilt für Claude Desktop — für andere Clients lesen Sie bitte deren Dokumentation.

Claude Desktop: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "test-utils": {
      "command": "D:\\path\\to\\mcp-test-utils.exe"
    }
  }
}
  1. Starten Sie Claude Desktop neu.

  2. Versuchen Sie im Chat: "Take a screenshot" — der Agent gibt ein Bild Ihres Desktops zurück.

Mit Protokollierung und Dateisuche (optional)

{
  "mcpServers": {
    "test-utils": {
      "command": "D:\\path\\to\\mcp-test-utils.exe",
      "env": {
        "MCP_LOG_DIR": "D:\\path\\to\\logs",
        "MCP_LOG_MAX_MB": "500",
        "MCP_LOG_RETAIN_DAYS": "30",
        "MCP_SEARCH_DIRS": "D:\\Projects\\app1;D:\\Projects\\app2"
      }
    }
  }
}

Qualitäts-Presets

Screenshots unterstützen konfigurierbare Qualität, um Detailgrad und Token-Kosten auszubalancieren:

Preset

Skalierung

Format

Anwendungsfall

full

100%

JPEG q90

Maximale Details

standard

50%

JPEG q70

Ausgewogen (Standard)

compact

50%

PNG

Wenn PNG benötigt wird

minimal

25%

Graustufen

Niedrigste Token-Kosten

custom

10–100%

JPEG / PNG / Graustufen

Volle Kontrolle

Umgebungsvariablen

Variable

Beschreibung

Standard

MCP_LOG_DIR

Pfad für Protokollsitzungen. Ohne diesen sind Protokollierungstools ausgeblendet

MCP_LOG_MAX_MB

Größenlimit für Sitzungen (Warnung bei Überschreitung)

500

MCP_LOG_RETAIN_DAYS

Sitzungen, die älter als N Tage sind, automatisch löschen. 0 zum Deaktivieren

30

MCP_SEARCH_DIRS

Erlaubte Verzeichnisse für search_in_files (; unter Windows, : unter macOS/Linux). Ohne diese ist das Tool ausgeblendet

Funktionsweise

MCP Test Utils ist ein JSON-RPC 2.0-Server, der über stdin/stdout kommuniziert. Jeder MCP-kompatible Client startet die Binärdatei, sendet Tool-Aufrufe und empfängt strukturierte Antworten (Text, Base64-Bilder). Getestet mit Claude Desktop.

Der Server verwendet direkt native Windows-APIs — Win32 GDI für Screenshots, SendInput für Maus und Tastatur, UI Automation COM API für die Elementinspektion, WinRT Windows.Media.Ocr für die Texterkennung. Die Dateisuche verwendet die ripgrep-Engine (grep-regex, grep-searcher, ignore) — plattformübergreifend, keine externen Abhängigkeiten. Kein PowerShell, keine externen Tools, kein Netzwerkzugriff.

Anwendungsfälle

  • Automatisierte Qualitätssicherung (QA) — Agent navigiert durch die App, klickt sich durch Abläufe, macht bei jedem Schritt Screenshots und schreibt einen Testbericht

  • Desktop-Automatisierung — Formulare ausfüllen, Daten zwischen Fenstern kopieren, Workflows ausführen

  • Barrierefreiheitsprüfung — UI-Automatisierungsbaum auf fehlende Beschriftungen oder Rollen scannen

  • Visuelle Regression — Screenshot-Vergleich über Releases hinweg

  • Datenextraktion — OCR-Text aus Anwendungen, die keine APIs bereitstellen

  • Codesuche — Muster über mehrere Projekte hinweg finden, ohne die Agentensitzung zu verlassen

Sicherheit

  • Reagiert nur auf Anfragen vom MCP-Client

  • Öffnet keine Netzwerkports

  • Schreibt nichts auf die Festplatte (außer bei Opt-in-Protokollierung)

  • Sendet keine Daten nach extern

  • Screenshots erfassen den gesamten Bildschirm — stellen Sie sicher, dass keine sensiblen Informationen sichtbar sind

  • Dateisuche ist in einer Sandbox — nur Verzeichnisse in MCP_SEARCH_DIRS sind zugänglich

Unterstützen Sie uns

Kostenlos und uneingeschränkt. Wenn Sie es nützlich finden — jeenyjai.github.io

Lizenz

Copyright 2026 JeenyJAI. Alle Rechte vorbehalten.


🚀 Erstellt mit Claude

-
security - not tested
F
license - not found
-
quality - not tested

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/JeenyJAI/mcp-test-utils'

If you have feedback or need assistance with the MCP directory API, please join our Discord server