Includes installation instructions and dependency configuration for running the automation server on CentOS/RHEL systems.
Provides installation guidance and dependency management for running the automation server on Debian-based systems.
Provides native Selenium implementation for Firefox browser automation with support for navigation, element interaction, and other web automation capabilities.
Supports Chrome browser automation with advanced detection evasion capabilities, including undetected-chromedriver integration and stealth mode features.
Supports running the automation server on macOS with specific installation instructions using Homebrew.
Implements Selenium WebDriver for browser automation with advanced features including element interaction, mouse/keyboard actions, screenshot capture, and JavaScript execution across supported browsers.
Includes specific installation instructions and dependency management for running the automation server on Ubuntu systems.
Servidor MCP Selenium WebDriver
Un servidor MCP (Model Context Protocol) completo que implementa Selenium WebDriver para automatización de navegadores con capacidades avanzadas de evasión de detección, soporte para múltiples navegadores y funcionalidades completas de interacción web.
Características Principales
🚀 Automatización Completa de Navegadores
Navegación web: Navegar a URLs, obtener información de páginas
Interacción con elementos: Buscar, hacer clic, escribir texto, subir archivos
Acciones de ratón: Hover, drag and drop, clic derecho, doble clic
Manejo de teclado: Envío de teclas especiales (Enter, Tab, flechas, etc.)
Capturas de pantalla: Pantalla completa o elementos específicos
Ejecución de JavaScript: Scripts personalizados en el navegador
🕵️ Evasión de Detección Avanzada
Undetected Chrome: Integración con undetected-chromedriver
Randomización: User agents y viewports aleatorios
Scripts stealth: Ocultación de propiedades de automatización
Simulación humana: Escritura y scroll con delays realistas
Gestión de cookies: Control completo de cookies y sesiones
🌐 Soporte Multi-Navegador
Chrome: Soporte completo con evasión de detección
Firefox: Implementación nativa de Selenium
Detección automática: Identificación de navegadores instalados
Configuraciones específicas: Optimizaciones por navegador
⚙️ Gestión Avanzada de Sesiones
Múltiples sesiones: Hasta 10 sesiones simultáneas por defecto
Gestión automática: Limpieza de sesiones expiradas
Configuraciones flexibles: Presets para diferentes casos de uso
Proxies: Soporte para HTTP, HTTPS y SOCKS
Instalación
Requisitos Previos
Python 3.8 o superior
Chrome y/o Firefox instalados
Dependencias del sistema para Selenium
Instalación de Dependencias
Dependencias del Sistema
Ubuntu/Debian
CentOS/RHEL
Windows
Descargar e instalar Chrome desde https://www.google.com/chrome/
Descargar e instalar Firefox desde https://www.mozilla.org/firefox/
macOS
Configuración
Configuraciones Predefinidas
El servidor incluye tres configuraciones predefinidas:
1. Configuración por Defecto
2. Configuración Stealth (Recomendada para evasión)
3. Configuración de Rendimiento
Configuración de Proxies
Uso Básico
Iniciar el Servidor
Ejemplo de Uso Básico
Herramientas MCP Disponibles
Gestión de Navegadores
Herramienta | Descripción |
| Inicia una nueva sesión de navegador |
| Cierra una sesión específica |
| Detecta navegadores instalados |
| Obtiene el navegador recomendado |
| Verifica soporte de WebDriver |
Navegación y Páginas
Herramienta | Descripción |
| Navega a una URL específica |
| Obtiene información de la página actual |
| Ejecuta JavaScript en el navegador |
Interacción con Elementos
Herramienta | Descripción |
| Busca elementos con diferentes estrategias |
| Hace clic en un elemento |
| Escribe texto en un elemento |
| Sube archivos a inputs de tipo file |
Acciones Avanzadas
Herramienta | Descripción |
| Acciones de ratón (hover, drag & drop) |
| Envía teclas especiales |
| Captura pantalla completa o elementos |
Evasión de Detección
Herramienta | Descripción |
| Aplica todas las técnicas stealth |
| Cambia a un user agent aleatorio |
| Cambia el tamaño de ventana |
| Escritura con delays humanos |
| Scroll gradual simulando humano |
| Agrega delays aleatorios |
Gestión de Sesiones
Herramienta | Descripción |
| Lista todas las sesiones activas |
| Información detallada de una sesión |
| Cierra todas las sesiones |
| Limpia sesiones expiradas |
Gestión de Cookies
Herramienta | Descripción |
| Gestión completa de cookies |
Configuración del Servidor
Herramienta | Descripción |
| Estado actual del servidor |
| Actualiza configuración con presets |
Ejemplos Avanzados
Automatización con Evasión de Detección
Automatización de Formularios
Scraping con Múltiples Sesiones
Estrategias de Localización de Elementos
El servidor soporta todas las estrategias estándar de Selenium:
Estrategia | Descripción | Ejemplo |
| Por atributo ID |
|
| Por atributo name |
|
| Por clase CSS |
|
| Por nombre de etiqueta |
|
| Selector CSS |
|
| Expresión XPath |
|
| Texto exacto del enlace |
|
| Texto parcial del enlace |
|
Ejemplos de Selectores
Configuración de Proxies
Tipos de Proxy Soportados
Manejo de Errores
El servidor maneja automáticamente los errores comunes y proporciona mensajes descriptivos:
Errores Comunes y Soluciones
Error | Causa | Solución |
| ID de sesión inválido | Verificar que la sesión esté activa |
| Selector incorrecto o elemento no visible | Revisar selector y aumentar timeout |
| Problema con el driver | Reinstalar webdriver-manager |
| Elemento no clickeable | Usar scroll o esperar a que sea visible |
Mejores Prácticas
Para Evasión de Detección
Usar configuración stealth: Siempre aplicar
STEALTH_CONFIG
para sitios que detectan botsDelays aleatorios: Agregar delays entre acciones para simular comportamiento humano
Randomización: Cambiar user agents y viewports regularmente
Gestión de cookies: Mantener cookies de sesión para parecer un usuario real
Scroll gradual: Usar
scroll_like_human
en lugar de scroll instantáneo
Para Rendimiento
Modo headless: Usar para operaciones en lote
Deshabilitar imágenes: Reducir tiempo de carga
Gestión de sesiones: Cerrar sesiones no utilizadas
Timeouts apropiados: Configurar timeouts según la velocidad del sitio
Para Estabilidad
Manejo de errores: Siempre verificar
success
en las respuestasLimpieza de sesiones: Usar
cleanup_expired_sessions
regularmenteVerificar elementos: Usar
find_element
antes de interactuarCapturas de pantalla: Tomar capturas para debugging
Limitaciones
Máximo de sesiones: 10 sesiones simultáneas por defecto (configurable)
Timeout de sesión: 1 hora por defecto (configurable)
Navegadores soportados: Chrome y Firefox únicamente
Detección: Algunos sitios avanzados pueden detectar automatización
Solución de Problemas
Problemas de Instalación
Problemas de Ejecución
Contribución
Para contribuir al proyecto:
Fork el repositorio
Crear una rama para la nueva característica
Implementar cambios con tests
Enviar pull request
Licencia
Este proyecto está bajo la licencia MIT.
This server cannot be installed
A complete Model Context Protocol server that implements Selenium WebDriver for browser automation with advanced detection evasion capabilities, multi-browser support, and comprehensive web interaction functionalities.
Related MCP Servers
- -securityFlicense-qualityA Model Context Protocol server that provides browser automation capabilities using BrowserCat's cloud browser service. This server enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a real browser environment without needing to install browsers locally.Last updated -73
- AsecurityAlicenseAqualityAI-driven browser automation server that implements the Model Context Protocol to enable natural language control of web browsers for tasks like navigation, form filling, and visual interaction.Last updated -12MIT License
- AsecurityFlicenseAqualityA Model Context Protocol server that provides browser automation capabilities for creating and testing Autoconsent rules, enabling LLMs to interact with web pages and test consent management platforms in a real browser environment.Last updated -10
- AsecurityAlicenseAqualityA Model Context Protocol server that connects to Chrome debugging ports, enabling browser automation with persistent login sessions.Last updated -10188MIT License