Skip to main content
Glama

AI Vision Debug MCP Server

Визуальный агент отладки пользовательского интерфейса MCP

Автономный отладочный сервер MCP, который позволяет моделям ИИ анализировать, отлаживать и взаимодействовать с веб-интерфейсами через Playwright. Этот сервер позволяет любой модели ИИ (даже без встроенных возможностей зрения) визуально проверять веб-страницы, находить ошибки пользовательского интерфейса, тестировать рабочие процессы пользователя и проверять производительность приложения — все это без вмешательства человека.

Скриншот автоматизации пользовательского интерфейса

Автономный агент отладки пользовательского интерфейса

Этот сервер MCP функционирует как автономный отладочный агент на базе искусственного интеллекта, который может:

  • Выполнять комплексный визуальный анализ веб-приложений
  • Выявляйте проблемы пользовательского интерфейса , проверяя визуальные элементы и их свойства.
  • Автоматически тестируйте общие рабочие процессы пользователей без создания ручного тестового сценария
  • Проверка конечных точек API и проверка ответов бэкэнда
  • Отслеживайте визуальные изменения между версиями приложения
  • Мониторинг журналов консоли на предмет ошибок и предупреждений.
  • Анализируйте показатели производительности для выявления узких мест
  • Создавайте подробные отчеты со снимками экрана и рекомендациями

Сервер спроектирован для интеллектуальной работы, повторно использует сеансы браузера, избегает создания ненужных файлов и фокусируется на наиболее важных аспектах вашего приложения.

Варианты установки

Использование шлюза MCP (рекомендуется)

Самый простой способ установки этого сервера MCP — через любой шлюз, совместимый с MCP:

# Example with Claude gateway claude-gateway install visual-ui-debug-agent-mcp

Скрипт быстрой установки

Воспользуйтесь нашим однострочным скриптом установки:

curl -s https://raw.githubusercontent.com/samihalawa/visual-ui-debug-agent-mcp/main/scripts/install-global.sh | bash

Установка НПМ

Для глобальной установки через npm:

# Install globally npm install -g visual-ui-debug-agent-mcp # Start the server visual-ui-debug-agent-mcp

Установка Docker Hub

Для контейнерного развертывания:

# Pull the image from Docker Hub docker pull samihalawa/visual-ui-debug-agent-mcp:latest # Run the container docker run -p 8080:8080 samihalawa/visual-ui-debug-agent-mcp:latest

Интеграция кузнечного дела

Этот пакет полностью совместим с Smithery благодаря включенному файлу конфигурации:

# Install with Smithery smithery install visual-ui-debug-agent-mcp # Or run with your API key npm run smithery:key YOUR_SMITHERY_API_KEY

Полные инструкции по установке и использованию см. в Руководстве по интеграции Smithery .

Полный справочник инструментов

Основные инструменты визуального анализа

1. enhanced_page_analyzer 🔍

Обеспечивает комплексный анализ веб-страниц с интерактивным отображением элементов, показателями производительности и визуальным контролем.

const analysis = await mcp.callTool("enhanced_page_analyzer", { url: "https://example.com/dashboard", includeConsole: true, mapElements: true, fullPage: true });
2. ui_workflow_validator 🔄

Автоматически тестирует все пути пользователя, выполняя и проверяя последовательность взаимодействий пользовательского интерфейса.

const result = await mcp.callTool("ui_workflow_validator", { startUrl: "https://example.com/login", taskDescription: "User login flow", steps: [ { description: "Enter username", action: "fill", selector: "#username", value: "test" }, { description: "Enter password", action: "fill", selector: "#password", value: "pass" }, { description: "Click login", action: "click", selector: "button[type='submit']" }, { description: "Verify dashboard loads", action: "verifyElementVisible", selector: ".dashboard" } ], captureScreenshots: "all" });
3. visual_comparison 👁️

Сравнивает две веб-страницы или состояния пользовательского интерфейса для выявления визуальных различий.

const diff = await mcp.callTool("visual_comparison", { url1: "https://example.com/before", url2: "https://example.com/after", threshold: 0.05 });
4. screenshot_url 📸

Делает высококачественные снимки экрана любого URL-адреса с возможностью создания снимков всей страницы или отдельных элементов.

const screenshot = await mcp.callTool("screenshot_url", { url: "https://example.com/profile", fullPage: true, device: "iPhone 13" });
5. batch_screenshot_urls 📷

Делает снимки экрана нескольких URL-адресов за одну операцию для эффективного сравнения.

const screenshots = await mcp.callTool("batch_screenshot_urls", { urls: ["https://example.com/page1", "https://example.com/page2"], fullPage: true });

Инструменты тестирования пользовательского потока

6. navigation_flow_validator 🧭

Тестирует многошаговые навигационные последовательности с проверкой.

const navResult = await mcp.callTool("navigation_flow_validator", { startUrl: "https://example.com", steps: [ { action: "click", selector: "a.products" }, { action: "wait", waitTime: 1000 }, { action: "click", selector: ".product-item" } ], captureScreenshots: true });
7. api_endpoint_tester 🔌

Тестирует несколько конечных точек API и проверяет ответы для внутренней валидации.

const apiTest = await mcp.callTool("api_endpoint_tester", { url: "https://api.example.com/v1", endpoints: [ { path: "/users", method: "GET" }, { path: "/products", method: "GET" } ], authToken: "Bearer token123" });

DOM и анализ производительности

8. dom_inspector 🔬

Детально проверяет элементы DOM и их свойства.

const elementInfo = await mcp.callTool("dom_inspector", { url: "https://example.com", selector: "nav.main-menu", includeChildren: true, includeStyles: true });
9. console_monitor 📟

Отслеживает и записывает журналы консоли для обнаружения ошибок.

const logs = await mcp.callTool("console_monitor", { url: "https://example.com/app", filterTypes: ["error", "warning"], duration: 5000 });
10. performance_analysis

Измеряет и анализирует показатели производительности загрузки страницы.

const perfMetrics = await mcp.callTool("performance_analysis", { url: "https://example.com/dashboard", iterations: 3 });

Низкоуровневые элементы управления драматургом

11. screenshot_local_files 📁

Делает снимки экрана локальных HTML-файлов.

const localScreenshot = await mcp.callTool("screenshot_local_files", { filePath: "/path/to/local/file.html" });
12. Прямые действия драматурга

Полный набор низкоуровневых элементов управления Playwright для точной автоматизации:

  • playwright_navigate : Перейти к определенным URL-адресам
  • playwright_click : Щелкните по элементам
  • playwright_iframe_click : Щелкните элементы внутри iframe
  • playwright_fill : Заполните поля формы
  • playwright_select : Выберите раскрывающиеся параметры
  • playwright_hover : Наведите курсор на элементы
  • playwright_evaluate : Запустить JavaScript в контексте страницы
  • playwright_console_logs : Получить логи консоли
  • playwright_get_visible_text : Извлечь видимый текст
  • playwright_get_visible_html : Получить видимый HTML
  • playwright_go_back : Перейти назад
  • playwright_go_forward : Перейти вперед
  • playwright_press_key : Нажмите клавиши клавиатуры
  • playwright_drag : Перетаскивание элементов
  • playwright_screenshot : Делайте пользовательские снимки экрана

Автономные рабочие процессы отладки

Сервер MCP может автономно выполнять полные рабочие процессы отладки, комбинируя инструменты. Например:

Визуальное регрессионное тестирование

// 1. Analyze the current version const currentAnalysis = await mcp.callTool("enhanced_page_analyzer", {...}); // 2. Compare with previous version const comparisonResult = await mcp.callTool("visual_comparison", {...}); // 3. Generate visual difference report const report = await mcp.callTool("ui_workflow_validator", {...});

Сквозная проверка потока пользователя

// 1. Start with login flow const loginResult = await mcp.callTool("ui_workflow_validator", {...}); // 2. Validate core features const featureResults = await mcp.callTool("navigation_flow_validator", {...}); // 3. Test API endpoints const apiResults = await mcp.callTool("api_endpoint_tester", {...});

Оптимизация производительности

// 1. Analyze initial performance const initialPerformance = await mcp.callTool("performance_analysis", {...}); // 2. Identify slow-loading elements const elementPerformance = await mcp.callTool("dom_inspector", {...}); // 3. Monitor console for errors const consoleErrors = await mcp.callTool("console_monitor", {...});

Примеры визуального анализа

Элементное отображение

Элементное отображение

Сервер MCP автоматически отображает все интерактивные элементы на странице, что упрощает понимание структуры пользовательского интерфейса для модели ИИ.

Визуальное сравнение

Визуальное сравнение

Инструмент визуального сравнения выявляет различия между состояниями пользовательского интерфейса, что идеально подходит для выявления неожиданных визуальных изменений.

Варианты интеграции

Интеграция с Smithery

# smithery.yaml configuration startCommand: type: stdio configSchema: type: object properties: port: type: number description: Port number for the MCP server debug: type: boolean description: Enable debug mode

Интеграция с GLAMA

// glama.json configuration { "name": "visual-ui-debug-agent-mcp", "version": "1.0.2", "settings": { "port": 8080, "headless": true, "maxConcurrentSessions": 5 } }

Интеграция с моделями, не относящимися к зрению

Сервер MCP преобразует визуальную информацию в структурированные данные, которые может использовать любая модель ИИ, даже не имеющая возможностей зрения:

// The model receives structured data about visual elements { "interactiveElements": [ { "tagName": "button", "text": "Submit", "bounds": {"x": 120, "y": 240, "width": 100, "height": 40}, "visible": true }, // More elements... ] }

Интеграция CI/CD

Этот сервер MCP включает рабочие процессы GitHub Actions для непрерывной интеграции и развертывания:

  • Сборка и тестирование : проверка качества кода
  • NPM Publishing : автоматизирует публикацию пакетов
  • Docker Publishing : создает и отправляет образы Docker.
  • Smithery Publishing : развертывание на платформе Smithery

Лицензия

Данный проект лицензирован по лицензии ISC .

Install Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Сервер протокола контекста модели, который предоставляет возможности искусственного интеллекта для анализа снимков экрана пользовательского интерфейса, предлагая инструменты для анализа экрана, операций с файлами и создания отчетов UI/UX.

  1. Автономный агент отладки пользовательского интерфейса
    1. Варианты установки
      1. Использование шлюза MCP (рекомендуется)
      2. Скрипт быстрой установки
      3. Установка НПМ
      4. Установка Docker Hub
      5. Интеграция кузнечного дела
    2. Полный справочник инструментов
      1. Основные инструменты визуального анализа
      2. Инструменты тестирования пользовательского потока
      3. DOM и анализ производительности
      4. Низкоуровневые элементы управления драматургом
    3. Автономные рабочие процессы отладки
      1. Визуальное регрессионное тестирование
      2. Сквозная проверка потока пользователя
      3. Оптимизация производительности
    4. Примеры визуального анализа
      1. Элементное отображение
      2. Визуальное сравнение
    5. Варианты интеграции
      1. Интеграция с Smithery
      2. Интеграция с GLAMA
      3. Интеграция с моделями, не относящимися к зрению
    6. Интеграция CI/CD
      1. Лицензия

        Related MCP Servers

        • A
          security
          A
          license
          A
          quality
          A Model Context Protocol server that provides browser automation capabilities using Playwright. This server enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a real browser environment.
          Last updated -
          13
          10,534
          3,956
          TypeScript
          MIT License
          • Linux
          • Apple
        • A
          security
          A
          license
          A
          quality
          An official MCP server implementation that allows AI assistants to capture website screenshots through the ScreenshotOne API, enabling visual context from web pages during conversations.
          Last updated -
          1
          4
          21
          TypeScript
          MIT License
          • Apple
        • -
          security
          F
          license
          -
          quality
          A server that provides rich UI context and interaction capabilities to AI models, enabling deep understanding of user interfaces through visual analysis and precise interaction via Model Context Protocol.
          Last updated -
          24
          Python
          • Linux
          • Apple
        • -
          security
          A
          license
          -
          quality
          A Model Context Protocol server enabling AI assistants to generate images through OpenAI's DALL-E API with full support for all available options and fine-grained control.
          Last updated -
          14
          1
          JavaScript
          MIT License

        View all related MCP servers

        MCP directory API

        We provide all the information about MCP servers via our MCP API.

        curl -X GET 'https://glama.ai/api/mcp/v1/servers/samihalawa/mcp-server-ai-vision'

        If you have feedback or need assistance with the MCP directory API, please join our Discord server