Servidor Selenium MCP
insignia de herrería
Un servidor MCP que usa Selenium para interactuar con una instancia de WebDriver. Creado con la plantilla MCP-Server-Starter .
Descripción general
Este servidor permite que los agentes de IA controlen una sesión de navegador web a través de Selenium WebDriver, lo que habilita tareas como raspado web, pruebas automatizadas y llenado de formularios a través del Protocolo de contexto de modelo.
Componentes principales
- Servidor MCP : expone las acciones de Selenium WebDriver como herramientas MCP.
- Selenium WebDriver : interactúa con el navegador.
- Clientes MCP : hosts de IA (como Cursor, Claude Desktop) que pueden utilizar las herramientas expuestas.
Prerrequisitos
- Node.js (v18 o posterior)
- npm (v7 o posterior)
- Un ejecutable WebDriver (por ejemplo, ChromeDriver, GeckoDriver) instalado y disponible en la RUTA de su sistema.
- Un navegador web compatible (por ejemplo, Chrome, Firefox).
Empezando
- Clonar el repositorio:
- Instalar dependencias:
- Configurar WebDriver:
- Asegúrese de que su WebDriver (por ejemplo,
chromedriver
) esté instalado y en su RUTA. - Modifique
src/seleniumService.ts
(creará este archivo) si es necesario para especificar las opciones del navegador o las rutas de WebDriver.
- Asegúrese de que su WebDriver (por ejemplo,
- Construir el servidor:
- Ejecutar el servidor:Alternativamente, intégrelo con un host MCP como Cursor o Claude Desktop (consulte las secciones de Integración a continuación).
Herramientas
Este servidor proporcionará herramientas como:
selenium_navigate
: navega el navegador a una URL específica.selenium_findElement
: encuentra un elemento en la página usando un selector CSS.selenium_click
: hace clic en un elemento.selenium_sendKeys
: envía pulsaciones de teclas a un elemento.selenium_getPageSource
: recupera el código HTML de la página actual.- (Agregue más herramientas según sea necesario)
Implementación de TypeScript
El servidor utiliza las bibliotecas @modelcontextprotocol/sdk
y selenium-webdriver
.
Desarrollo
- Construir:
npm run build
- Ejecutar:
npm start
(ejecutanode build/index.js
) - Pelusa:
npm run lint
- Formato:
npm run format
Depuración
Utilice el Inspector MCP o las técnicas de depuración estándar de Node.js.
Integración con hosts MCP
(Conserve las secciones relevantes del README original para Cursor, Claude Desktop, Smithery, etc., actualizando rutas y comandos según sea necesario)
Integración del cursor
- Construye tu servidor :
npm run build
- En el cursor:
Settings
>Features
>MCP
: agregar un nuevo servidor MCP. - Registra tu servidor :
- Seleccione
stdio
como tipo de transporte. - Nombre:
Selenium Server
(o similar). - Comando:
node /path/to/selenium-mcp-server/build/index.js
.
- Seleccione
- Ahorrar .
Integración de escritorio de Claude
- Construye tu servidor :
npm run build
- Modificar
claude_desktop_config.json
: - Reinicie Claude Desktop .
Mejores prácticas
- Utilice TypeScript y Zod para la seguridad y validación de tipos.
- Mantenga las herramientas modulares (por ejemplo, un archivo por herramienta en
src/tools/
). - Maneje los errores de WebDriver con elegancia (por ejemplo, elemento no encontrado, problemas de navegación).
- Asegúrese de que WebDriver se apague correctamente (por ejemplo,
driver.quit()
al salir del servidor). - Siga las mejores prácticas de MCP para esquemas, manejo de errores y tipos de contenido.
Más información
- Documentación del protocolo de contexto del modelo
- Documentación de Selenium WebDriver JS
- Documentación del SDK de TypeScript de MCP
Créditos
Basado en la plantilla creada por Seth Rose :
- Sitio web : https://www.sethrose.dev
- 𝕏 (Twitter) : https://x.com/TheSethRose
- 🦋 (Cielo azul) : https://bsky.app/profile/sethrose.dev
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Permite que los agentes de IA controlen las sesiones del navegador web a través de Selenium WebDriver, lo que habilita tareas de automatización web como raspado, pruebas y llenado de formularios a través del Protocolo de contexto de modelo.
Related MCP Servers
- AsecurityFlicenseAqualityEnables AI agents to interact with web browsers using natural language, featuring automated browsing, form filling, vision-based element detection, and structured JSON responses for systematic browser control.Last updated -146Python
- -securityFlicense-qualityEnables AI agents to control web browsers via a standardized interface for operations like launching, interacting with, and closing browsers.Last updated -0JavaScript
- -securityFlicense-qualityA web browser automation server that allows AI assistants to control Chrome with persistent state management, enabling complex browsing tasks through asynchronous browser operations.Last updated -1Python
- -securityAlicense-qualityAI-driven browser automation server that implements the Model Context Protocol to enable natural language control of web browsers for tasks like navigation, form filling, and visual interaction.Last updated -1PythonMIT License