mcp-test-utils
MCP Test Utils
100% KI-Code · Von Menschen geprüft
MCP-Server für automatisierte Desktop-UI-Tests. Eine einzelne Binärdatei — keine Laufzeitumgebung, keine Abhängigkeiten, keine Installation.
Nur Windows x64. Unterstützung für macOS und Linux ist geplant.
Verleiht KI-Agenten Augen und Hände: Screenshots, Fensterverwaltung, Maus, Tastatur, UI-Automatisierung, OCR, Dateisuche.
Warum
KI-Agenten können Aktionen in Anwendungen auslösen, aber den Bildschirm nicht sehen. Dieser Server schließt diese Lücke:
Agent triggers action → takes screenshot → sees the result →
switches window → clicks a button → verifies → writes reportVollständig autonom, kein Benutzereingriff erforderlich.
Demo
10 Aufgaben. Ein Durchgang. Auf YouTube ansehen →

MCP Test Utils vs. Anthropic Computer Use
Claude Cowork enthält jetzt integrierte Computer Use — Claude macht Screenshots und klickt sich visuell durch Oberflächen. Es funktioniert ohne Einrichtung. MCP Test Utils verfolgt einen anderen Ansatz: Anstatt aus einem Screenshot zu erraten, wo geklickt werden soll, liest es die tatsächliche UI-Struktur über Windows-APIs aus.
MCP Test Utils | Computer Use | |
Klickpräzision | Exakt — UI Automation API | Visuelle Schätzung aus Screenshot |
Geschwindigkeit & Token-Kosten | Schnell, kostengünstig — Textantworten | Langsamer, teurer — Bild bei jedem Schritt |
UI-Struktur | Vollständiger Baum: Rollen, Zustände, Koordinaten | Nicht verfügbar |
OCR | Wortgenaue Koordinaten, mehrsprachig | Nicht verfügbar (nur Modell-Vision) |
Fensterverwaltung | API-basiert, fensterrelative Koordinaten | Visuelle Navigation |
Dateisuche | Ripgrep-Engine integriert | Nicht verfügbar |
Sitzungsprotokollierung | JSONL + Screenshots | Nicht verfügbar |
Visuelle Analyse | ✅ Dasselbe Claude-Modell, volle Auflösung 1:1 | ✅ Dasselbe Claude-Modell |
Einrichtung | Binärdatei herunterladen, zur Konfiguration hinzufügen | Integriert, ein Schalter |
Mobil / Dispatch | — | ✅ Aufgaben vom Telefon |
Plattformübergreifend | Windows (macOS/Linux geplant) | macOS + Windows |
MCP Test Utils ist schneller, präziser und pro Aktion günstiger. Computer Use ist einfacher zu starten und funktioniert plattformübergreifend. Sie ergänzen sich gegenseitig.
Plattformen
Plattform | Status |
Windows x64 | ✅ Volle Unterstützung |
macOS arm64 | ⏳ Geplant |
Linux x64 | ⏳ Geplant |
Tools (19)
Vision
Tool | Beschreibung |
| Screenshot des gesamten Desktops mit konfigurierbarer Qualität |
| Screenshot eines bestimmten Fensters (Bildschirm- oder Fensteraufnahmemodus) |
| OCR des gesamten Bildschirms (Windows.Media.Ocr) |
| OCR eines Bildschirmbereichs mit präzisen Wortkoordinaten |
Fensterverwaltung
Tool | Beschreibung |
| Auflistung der Fenster mit ID, Titel, App, Position, Größe, minimiert, fokussiert |
| Fenster in den Vordergrund bringen, wiederherstellen, falls minimiert |
Eingabe
Tool | Beschreibung |
| Klicken (links / rechts / mitte) an bildschirm- oder fensterrelativen Koordinaten |
| Cursor zu einem Punkt bewegen |
| Von Punkt A nach Punkt B ziehen |
| Mausrad scrollen |
| Text eingeben (vollständiges Unicode — Lateinisch, Kyrillisch, CJK, Emoji) |
| Taste drücken (Enter, Tab, F1–F12, Pfeile usw.) |
| Tastenkombinationen (Strg+S, Alt+F4, Strg+Umschalt+P usw.) |
Strukturierter UI-Zugriff
Tool | Beschreibung |
| UI-Automatisierungsbaum — Schaltflächen, Felder, Menüs mit exakten Koordinaten |
Dateisuche
Tool | Beschreibung |
| Suche nach Text oder Regex in Dateien innerhalb erlaubter Verzeichnisse (wie VS Code „In Dateien suchen“) |
| Dateien und Verzeichnisse nach Namensmuster (Glob) finden, wie „Gehe zu Datei“ |
Agenten-Leitfaden
Tool | Beschreibung |
| Kompakter Workflow-Leitfaden für LLM-Agenten — präzises Klicken, Koordinaten-Metadaten, Qualitätstipps |
Sitzungsprotokollierung
Tool | Beschreibung |
| Aufzeichnung von Tool-Aufrufen in JSONL + Screenshots starten (Opt-in) |
| Aufzeichnung stoppen, Sitzungsstatistiken abrufen |
Installation
Laden Sie die Binärdatei von Releases herunter.
Fügen Sie sie Ihrer MCP-Client-Konfiguration hinzu. Das folgende Beispiel gilt für Claude Desktop — für andere Clients lesen Sie bitte deren Dokumentation.
Claude Desktop: %APPDATA%\Claude\claude_desktop_config.json
{
"mcpServers": {
"test-utils": {
"command": "D:\\path\\to\\mcp-test-utils.exe"
}
}
}Starten Sie Claude Desktop neu.
Versuchen Sie im Chat: "Take a screenshot" — der Agent gibt ein Bild Ihres Desktops zurück.
Mit Protokollierung und Dateisuche (optional)
{
"mcpServers": {
"test-utils": {
"command": "D:\\path\\to\\mcp-test-utils.exe",
"env": {
"MCP_LOG_DIR": "D:\\path\\to\\logs",
"MCP_LOG_MAX_MB": "500",
"MCP_LOG_RETAIN_DAYS": "30",
"MCP_SEARCH_DIRS": "D:\\Projects\\app1;D:\\Projects\\app2"
}
}
}
}Qualitäts-Presets
Screenshots unterstützen konfigurierbare Qualität, um Detailgrad und Token-Kosten auszubalancieren:
Preset | Skalierung | Format | Anwendungsfall |
| 100% | JPEG q90 | Maximale Details |
| 50% | JPEG q70 | Ausgewogen (Standard) |
| 50% | PNG | Wenn PNG benötigt wird |
| 25% | Graustufen | Niedrigste Token-Kosten |
| 10–100% | JPEG / PNG / Graustufen | Volle Kontrolle |
Umgebungsvariablen
Variable | Beschreibung | Standard |
| Pfad für Protokollsitzungen. Ohne diesen sind Protokollierungstools ausgeblendet | — |
| Größenlimit für Sitzungen (Warnung bei Überschreitung) |
|
| Sitzungen, die älter als N Tage sind, automatisch löschen. |
|
| Erlaubte Verzeichnisse für | — |
Funktionsweise
MCP Test Utils ist ein JSON-RPC 2.0-Server, der über stdin/stdout kommuniziert. Jeder MCP-kompatible Client startet die Binärdatei, sendet Tool-Aufrufe und empfängt strukturierte Antworten (Text, Base64-Bilder). Getestet mit Claude Desktop.
Der Server verwendet direkt native Windows-APIs — Win32 GDI für Screenshots, SendInput für Maus und Tastatur, UI Automation COM API für die Elementinspektion, WinRT Windows.Media.Ocr für die Texterkennung. Die Dateisuche verwendet die ripgrep-Engine (grep-regex, grep-searcher, ignore) — plattformübergreifend, keine externen Abhängigkeiten. Kein PowerShell, keine externen Tools, kein Netzwerkzugriff.
Anwendungsfälle
Automatisierte Qualitätssicherung (QA) — Agent navigiert durch die App, klickt sich durch Abläufe, macht bei jedem Schritt Screenshots und schreibt einen Testbericht
Desktop-Automatisierung — Formulare ausfüllen, Daten zwischen Fenstern kopieren, Workflows ausführen
Barrierefreiheitsprüfung — UI-Automatisierungsbaum auf fehlende Beschriftungen oder Rollen scannen
Visuelle Regression — Screenshot-Vergleich über Releases hinweg
Datenextraktion — OCR-Text aus Anwendungen, die keine APIs bereitstellen
Codesuche — Muster über mehrere Projekte hinweg finden, ohne die Agentensitzung zu verlassen
Sicherheit
Reagiert nur auf Anfragen vom MCP-Client
Öffnet keine Netzwerkports
Schreibt nichts auf die Festplatte (außer bei Opt-in-Protokollierung)
Sendet keine Daten nach extern
Screenshots erfassen den gesamten Bildschirm — stellen Sie sicher, dass keine sensiblen Informationen sichtbar sind
Dateisuche ist in einer Sandbox — nur Verzeichnisse in
MCP_SEARCH_DIRSsind zugänglich
Unterstützen Sie uns
Kostenlos und uneingeschränkt. Wenn Sie es nützlich finden — jeenyjai.github.io
Lizenz
Copyright 2026 JeenyJAI. Alle Rechte vorbehalten.
🚀 Erstellt mit Claude
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/JeenyJAI/mcp-test-utils'
If you have feedback or need assistance with the MCP directory API, please join our Discord server