Vibradores Ojos
Un servidor MCP que permite a los LLM "ver" lo que sucede en juegos y aplicaciones basados en navegador a través de visualización de lienzo vectorizado e información de depuración.
Vibe-Eyes utiliza una arquitectura cliente-servidor donde un cliente de navegador liviano captura el contenido del lienzo y la información de depuración, lo envía a un servidor Node.js a través de WebSockets, que luego vectoriza las imágenes en representaciones SVG compactas y las pone a disposición de los LLM a través del Protocolo de contexto de modelo (MCP).
Nota: Este proyecto es experimental y está diseñado para mejorar las sesiones de "codificación de vibraciones" con LLM al brindar contexto visual e información de depuración enriquecida.
Explicación en vídeo
Capacidades clave
- Captura y vectoriza elementos del lienzo de los juegos de navegador.
- Recopila registros y errores de la consola en tiempo real
- Captura excepciones no controladas con seguimientos de pila completos
- Hace que la información visual y de depuración esté disponible para los LLM a través de MCP
- Crea una experiencia de depuración perfecta para los desarrolladores que trabajan con LLM
Cómo funciona
- Un cliente liviano se ejecuta en el juego/aplicación del navegador.
- El cliente captura instantáneas del lienzo, registros/errores de la consola y excepciones no controladas.
- Los datos se envían al servidor Vibe-Eyes a través de WebSocket (evitando problemas de CORS)
- El servidor vectoriza las imágenes del lienzo y las almacena con la información de depuración
- Los LLM se conectan a través del Protocolo de Contexto de Modelo para acceder a los datos más recientes
- Los LLM pueden "ver" lo que está sucediendo y ayudar a depurar problemas con contexto completo
Componentes
1. Servidor MCP Vibe-Eyes ( mcp.js
)
El servidor central que:
- Recibe instantáneas del lienzo a través de Socket.IO
- Vectoriza imágenes para compactar la representación SVG (aproximación aproximada)
- Almacena información de depuración (registros, errores, excepciones, tiempos)
- Expone los datos a través del Protocolo de Contexto de Modelo (MCP)
- Proporciona puntos finales HTTP para acceso directo
- Procesa imágenes secuencialmente para administrar recursos
2. Cliente del navegador
El cliente del navegador está disponible en el repositorio vibe-eyes-client .
Una integración de navegador liviana que:
- Encuentra elementos del lienzo en la página.
- Captura el contenido del lienzo como URL de datos
- Intercepta registros y errores de la consola
- Detecta excepciones globales no controladas con seguimientos de pila
- Envía datos al servidor Vibe-Eyes a través de WebSockets
- Minimiza el impacto en el rendimiento de los juegos.
- Admite la inicialización explícita para controlar cuándo comienza la captura
3. Motor de vectorización ( vectorizer.js
)
Una biblioteca de vectorización SVG de alta calidad que:
- Convierte imágenes rasterizadas en archivos SVG vectoriales
- Optimiza los SVG para mejorar el tamaño y la claridad
- Conserva la información visual mientras reduce el tamaño de los datos
Empezando
Instalación
Uso con agentes LLM
Registre el servidor MCP con su agente de IA:
Esto le permite a Claude utilizar las capacidades de Vibe-Eyes a través de MCP.
Integración con juegos/aplicaciones
Agregue el cliente a su aplicación de navegador incluyendo los scripts necesarios:
Uso con Claude u otros LLM
El servidor MCP expone una herramienta para que los LLM accedan a la información visual y de depuración más reciente a través del Protocolo de contexto de modelo (MCP):
El Máster recibirá:
- Registros y errores recientes de la consola de la aplicación
- Excepciones no controladas con seguimiento de pila completo (si se produjeron)
- Aproximación SVG vectorizada del lienzo (si
includeSvg
es verdadero) - Información de tiempo y correlación para conectar el estado visual con los registros
Esto permite al LLM “ver” lo que está sucediendo en la aplicación y brindar una mejor asistencia.
Ejemplo de configuración de MCP (para Claude Code)
Para acceder a Vibe-Eyes de Claude:
Cómo Vibe-Eyes ayuda con la codificación de vibraciones
Las sesiones tradicionales de "codificación de vibraciones" requieren que los desarrolladores tomen capturas de pantalla manualmente y describan lo que sucede en su aplicación. Vibe-Eyes automatiza este proceso mediante:
- Proporcionar contexto visual : los LLM pueden ver el estado visual real del juego/aplicación
- Correlación de problemas visuales y de código : los registros de la consola se emparejan con el estado visual
- Reducción del trabajo manual : no es necesario capturar ni cargar capturas de pantalla manualmente
- Habilitación de la depuración en tiempo real : los LLM pueden observar los cambios a medida que ocurren
- Optimización de la transferencia de datos : la representación vectorial es más compacta que las capturas de pantalla
Consideraciones de rendimiento
- El cliente del navegador está diseñado para minimizar el impacto en el rendimiento de la aplicación.
- La creación de URL de datos de lienzo puede consumir muchos recursos de la CPU, por lo que la frecuencia de captura es configurable
- El transporte WebSocket evita los problemas CORS comunes en configuraciones entre dominios
- El servidor procesa las imágenes secuencialmente para evitar la sobrecarga.
- La vectorización SVG equilibra la precisión visual con la optimización del tamaño
Acceso directo a SVG
Para aplicaciones que quieran reutilizar la salida SVG vectorizada:
- Respuesta de WebSocket : el servidor incluye el SVG directamente en las respuestas de WebSocket:
- Punto final HTTP : acceda a la última captura a través del punto final
/latest
:
Referencia de API
Cliente de navegador
Herramienta MCP
CLI del vectorizador independiente
El proyecto también incluye una herramienta CLI independiente para vectorizar archivos individuales:
Licencia
ISC
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Un servidor MCP que permite a los LLM "ver" lo que sucede en juegos y aplicaciones basados en navegador a través de visualización de lienzo vectorizado e información de depuración.
Related MCP Servers
- -securityAlicense-qualityAn MCP server that connects any MCP client (like Claude or Cursor) with the browser using browser-use, allowing clients to utilize existing LLMs without requiring additional API keys.Last updated -72PythonApache 2.0
- AsecurityAlicenseAqualityAn MCP Server that enables LLMs to build real-time 3D web applications in the PlayCanvas Editor.Last updated -21154TypeScriptMIT License
- -securityAlicense-qualityAn open-source MCP server that provides applications like Cursor, Windsurf, and Claude with access to llms.txt documentation files, allowing users to control and audit context retrieval.Last updated -8PythonMIT License
- -securityAlicense-qualityA server that implements the Model Context Protocol (MCP), providing an interface for LLM applications to generate mermaid.js visualizations and diagrams.Last updated -PythonMIT License