Servidor Selenium MCP
insignia de herrería
Un servidor MCP que usa Selenium para interactuar con una instancia de WebDriver. Creado con la plantilla MCP-Server-Starter .
Descripción general
Este servidor permite que los agentes de IA controlen una sesión de navegador web a través de Selenium WebDriver, lo que habilita tareas como raspado web, pruebas automatizadas y llenado de formularios a través del Protocolo de contexto de modelo.
Componentes principales
Servidor MCP : expone las acciones de Selenium WebDriver como herramientas MCP.
Selenium WebDriver : interactúa con el navegador.
Clientes MCP : hosts de IA (como Cursor, Claude Desktop) que pueden utilizar las herramientas expuestas.
Prerrequisitos
Node.js (v18 o posterior)
npm (v7 o posterior)
Un ejecutable WebDriver (por ejemplo, ChromeDriver, GeckoDriver) instalado y disponible en la RUTA de su sistema.
Un navegador web compatible (por ejemplo, Chrome, Firefox).
Empezando
Clonar el repositorio:
git clone <your-repo-url> selenium-mcp-server cd selenium-mcp-serverInstalar dependencias:
npm installConfigurar WebDriver:
Asegúrese de que su WebDriver (por ejemplo,
chromedriver
) esté instalado y en su RUTA.Modifique
src/seleniumService.ts
(creará este archivo) si es necesario para especificar las opciones del navegador o las rutas de WebDriver.
Construir el servidor:
npm run buildEjecutar el servidor:
npm startAlternativamente, intégrelo con un host MCP como Cursor o Claude Desktop (consulte las secciones de Integración a continuación).
Herramientas
Este servidor proporcionará herramientas como:
selenium_navigate
: navega el navegador a una URL específica.selenium_findElement
: encuentra un elemento en la página usando un selector CSS.selenium_click
: hace clic en un elemento.selenium_sendKeys
: envía pulsaciones de teclas a un elemento.selenium_getPageSource
: recupera el código HTML de la página actual.(Agregue más herramientas según sea necesario)
Implementación de TypeScript
El servidor utiliza las bibliotecas @modelcontextprotocol/sdk
y selenium-webdriver
.
Desarrollo
Construir:
npm run build
Ejecutar:
npm start
(ejecutanode build/index.js
)Pelusa:
npm run lint
Formato:
npm run format
Depuración
Utilice el Inspector MCP o las técnicas de depuración estándar de Node.js.
Integración con hosts MCP
(Conserve las secciones relevantes del README original para Cursor, Claude Desktop, Smithery, etc., actualizando rutas y comandos según sea necesario)
Integración del cursor
Construye tu servidor :
npm run build
En el cursor:
Settings
>Features
>MCP
: agregar un nuevo servidor MCP.Registra tu servidor :
Seleccione
stdio
como tipo de transporte.Nombre:
Selenium Server
(o similar).Comando:
node /path/to/selenium-mcp-server/build/index.js
.
Ahorrar .
Integración de escritorio de Claude
Construye tu servidor :
npm run build
Modificar
claude_desktop_config.json
:{ "mcpServers": { "selenium-mcp-server": { "command": "node", "args": [ "/path/to/selenium-mcp-server/build/index.js" ] } } }Reinicie Claude Desktop .
Mejores prácticas
Utilice TypeScript y Zod para la seguridad y validación de tipos.
Mantenga las herramientas modulares (por ejemplo, un archivo por herramienta en
src/tools/
).Maneje los errores de WebDriver con elegancia (por ejemplo, elemento no encontrado, problemas de navegación).
Asegúrese de que WebDriver se apague correctamente (por ejemplo,
driver.quit()
al salir del servidor).Siga las mejores prácticas de MCP para esquemas, manejo de errores y tipos de contenido.
Más información
Créditos
Basado en la plantilla creada por Seth Rose :
Sitio web : https://www.sethrose.dev
𝕏 (Twitter) : https://x.com/TheSethRose
🦋 (Cielo azul) : https://bsky.app/profile/sethrose.dev
local-only server
The server can only run on the client's local machine because it depends on local resources.
Tools
Permite que los agentes de IA controlen las sesiones del navegador web a través de Selenium WebDriver, lo que habilita tareas de automatización web como raspado, pruebas y llenado de formularios a través del Protocolo de contexto de modelo.
Related MCP Servers
- -securityFlicense-qualityEnables AI agents to control web browsers via a standardized interface for operations like launching, interacting with, and closing browsers.
- AsecurityAlicenseAqualityAI-driven browser automation server that implements the Model Context Protocol to enable natural language control of web browsers for tasks like navigation, form filling, and visual interaction.Last updated -12MIT License
- -securityAlicense-qualityEmpowers AI agents to perform web browsing, automation, and scraping tasks with minimal supervision using natural language instructions and Selenium.Last updated -4Apache 2.0
- -securityFlicense-qualityEnables AI assistants to control a browser through a set of tools, allowing them to perform web automation tasks like navigation, typing, clicking, and taking screenshots.Last updated -