Visueller UI-Debug-Agent MCP
Ein autonomer MCP-Debugging-Server, der KI-Modellen die Analyse, Fehlerbehebung und Interaktion mit Weboberflächen über Playwright ermöglicht. Dieser Server ermöglicht es jedem KI-Modell (auch solchen ohne integrierte Bildverarbeitungsfunktionen), Webseiten visuell zu prüfen, UI-Fehler zu finden, Benutzer-Workflows zu testen und die Anwendungsleistung zu validieren – alles ohne menschliches Eingreifen.
Autonomer UI-Debugging-Agent
Dieser MCP-Server fungiert als KI-gestützter autonomer Debugging-Agent, der Folgendes kann:
- Führen Sie eine umfassende visuelle Analyse von Webanwendungen durch
- Erkennen Sie UI-Probleme durch die Überprüfung visueller Elemente und ihrer Eigenschaften
- Automatisches Testen gängiger Benutzer-Workflows ohne manuelles Erstellen von Testskripten
- Validieren Sie API-Endpunkte und verifizieren Sie Backend-Antworten
- Visuelle Änderungen zwischen Anwendungsversionen verfolgen
- Überwachen Sie Konsolenprotokolle auf Fehler und Warnungen
- Analysieren Sie Leistungsmetriken, um Engpässe zu identifizieren
- Erstellen Sie detaillierte Berichte mit Screenshots und Empfehlungen
Der Server ist auf intelligente Arbeitsweise ausgelegt, indem er Browsersitzungen wiederverwendet, die Erstellung unnötiger Dateien vermeidet und sich auf die wichtigsten Aspekte Ihrer Anwendung konzentriert.
Installationsoptionen
Verwendung eines MCP-Gateways (empfohlen)
Die einfachste Möglichkeit, diesen MCP-Server zu installieren, ist über ein beliebiges MCP-kompatibles Gateway:
Schnellinstallationsskript
Verwenden Sie unser einzeiliges Installationsskript:
NPM-Installation
Für die globale Installation über npm:
Docker Hub-Installation
Für die containerisierte Bereitstellung:
Smithery Integration
Dieses Paket ist mithilfe der enthaltenen Konfigurationsdatei vollständig Smithery-kompatibel:
Vollständige Installations- und Verwendungsanweisungen finden Sie im Smithery Integration Guide .
Vollständige Werkzeugreferenz
Primäre visuelle Analysetools
1. enhanced_page_analyzer
🔍
Bietet umfassende Analyse von Webseiten mit Zuordnung interaktiver Elemente, Leistungsmetriken und visueller Überprüfung.
2. ui_workflow_validator
🔄
Testet automatisch vollständige Benutzerreisen, indem eine Abfolge von UI-Interaktionen ausgeführt und validiert wird.
3. visual_comparison
👁️
Vergleicht zwei Webseiten oder UI-Zustände, um visuelle Unterschiede zu erkennen.
4. screenshot_url
📸
Erfasst qualitativ hochwertige Screenshots jeder URL mit Optionen für die ganze Seite oder bestimmte Elemente.
5. batch_screenshot_urls
📷
Erstellt in einem einzigen Vorgang Screenshots von mehreren URLs für einen effizienten Vergleich.
Tools zum Testen des Benutzerflusses
6. navigation_flow_validator
🧭
Testet mehrstufige Navigationssequenzen mit Validierung.
7. api_endpoint_tester
🔌
Testet mehrere API-Endpunkte und überprüft Antworten zur Backend-Validierung.
DOM und Leistungsanalyse
8. dom_inspector
🔬
Untersucht DOM-Elemente und ihre Eigenschaften im Detail.
9. console_monitor
📟
Überwacht und erfasst Konsolenprotokolle zur Fehlererkennung.
10. performance_analysis
⚡
Misst und analysiert Leistungsmetriken beim Seitenladen.
Einfache Playwright-Steuerelemente
11. screenshot_local_files
📁
Macht Screenshots von lokalen HTML-Dateien.
12. Direkte Aktionen des Dramatikers
Vollständiger Satz Low-Level-Playwright-Steuerelemente für präzise Automatisierung:
playwright_navigate
: Navigieren Sie zu bestimmten URLsplaywright_click
: Klicken Sie auf Elementeplaywright_iframe_click
: Klicken Sie auf Elemente innerhalb von Iframesplaywright_fill
: Formularfelder ausfüllenplaywright_select
: Dropdown-Optionen auswählenplaywright_hover
: Bewegen Sie den Mauszeiger über die Elementeplaywright_evaluate
: Führen Sie JavaScript im Seitenkontext ausplaywright_console_logs
: Konsolenprotokolle abrufenplaywright_get_visible_text
: Sichtbaren Text extrahierenplaywright_get_visible_html
: Sichtbares HTML abrufenplaywright_go_back
: Zurück navigierenplaywright_go_forward
: Vorwärts navigierenplaywright_press_key
: Drücken Sie die Tastaturtastenplaywright_drag
: Elemente per Drag & Drop verschiebenplaywright_screenshot
: Machen Sie benutzerdefinierte Screenshots
Autonome Debugging-Workflows
Der MCP-Server kann durch die Kombination von Tools komplette Debugging-Workflows autonom durchführen. Zum Beispiel:
Visuelle Regressionstests
End-to-End-Benutzerflussvalidierung
Leistungsoptimierung
Beispiele für visuelle Analysen
Elementzuordnung
Der MCP-Server ordnet alle interaktiven Elemente einer Seite automatisch zu, sodass ein KI-Modell die UI-Struktur leicht verstehen kann.
Visueller Vergleich
Das visuelle Vergleichstool hebt Unterschiede zwischen UI-Zuständen hervor und ist perfekt geeignet, um unerwartete visuelle Änderungen zu erkennen.
Integrationsoptionen
Integration mit Smithery
Integration mit GLAMA
Integration mit Nicht-Vision-Modellen
Der MCP-Server wandelt visuelle Informationen in strukturierte Daten um, die von jedem KI-Modell verwendet werden können, auch von solchen ohne visuelle Fähigkeiten:
CI/CD-Integration
Dieser MCP-Server umfasst GitHub Actions-Workflows für kontinuierliche Integration und Bereitstellung:
- Erstellen und Testen : Validiert die Codequalität
- NPM Publishing : Automatisiert die Paketveröffentlichung
- Docker-Publishing : Erstellt und pusht Docker-Images
- Smithery Publishing : Bereitstellung auf der Smithery-Plattform
Lizenz
Dieses Projekt ist unter der ISC-Lizenz lizenziert.
You must be authenticated.
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Tools
Ein Model Context Protocol-Server, der KI-Vision-Funktionen zur Analyse von UI-Screenshots bereitstellt und Tools für Bildschirmanalysen, Dateivorgänge und die Erstellung von UI/UX-Berichten bietet.
- Autonomer UI-Debugging-Agent
- Installationsoptionen
- Vollständige Werkzeugreferenz
- Autonome Debugging-Workflows
- Beispiele für visuelle Analysen
- Integrationsoptionen
- CI/CD-Integration
- Lizenz
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityA Model Context Protocol server that provides browser automation capabilities using Playwright. This server enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a real browser environment.Last updated -135,5973,440TypeScriptMIT License
- AsecurityAlicenseAqualityAn official MCP server implementation that allows AI assistants to capture website screenshots through the ScreenshotOne API, enabling visual context from web pages during conversations.Last updated -16TypeScriptMIT License
- -securityFlicense-qualityA server that provides rich UI context and interaction capabilities to AI models, enabling deep understanding of user interfaces through visual analysis and precise interaction via Model Context Protocol.Last updated -24Python
- -security-license-qualityA Model Context Protocol server enabling AI assistants to generate images through OpenAI's DALL-E API with full support for all available options and fine-grained control.Last updated -JavaScriptMIT License