Servidor MCP que utiliza el navegador
Nota del proyecto : Esta implementación del servidor MCP se basa en la base del uso del navegador y la interfaz web . La lógica principal de automatización del navegador y los patrones de configuración se adaptaron del proyecto original.
Servidor de automatización de navegador impulsado por IA que implementa el Protocolo de contexto de modelo (MCP) para el control del navegador en lenguaje natural.
Características
- 🧠 Integración MCP : implementación completa del protocolo para la comunicación con agentes de IA
- 🌐 Automatización del navegador : navegación de páginas, llenado de formularios e interacción con elementos
- 👁️ Comprensión visual : análisis de capturas de pantalla e interacciones basadas en la visión
- 🔄 Persistencia del estado : mantener las sesiones del navegador entre tareas
- 🔌 Compatibilidad con múltiples LLM : integración con OpenAI, Anthropic, Azure y DeepSeek
Inicio rápido
Prerrequisitos
- Python 3.11 o superior
- uv (instalador rápido de paquetes de Python)
- Navegador Chrome/Chromium
Instalación
Escritorio de Claude
En MacOS: ~/Library/Application\ Support/Claude/claude_desktop_config.json
En Windows: %APPDATA%/Claude/claude_desktop_config.json
Desarrollo local
Desarrollo
Solución de problemas
- Conflictos del navegador : cierre todas las instancias de Chrome antes de comenzar.
- Errores de API : Verifique que las claves de API en las variables de entorno coincidan con su proveedor de LLM.
- Soporte de visión : asegúrese de que
MCP_USE_VISION=true
para el análisis de capturas de pantalla.
Configuración del proveedor
El servidor admite múltiples proveedores LLM mediante variables de entorno. Estas son las opciones disponibles para MCP_MODEL_PROVIDER
:
Proveedor | Valor | Variables de entorno requeridas |
---|---|---|
Antrópico | anthropic | CLAVE DE API ANTHROPIC_API_KEY PUNTO FINAL ANTHROPIC_ENDPOINT (opcional) |
OpenAI | openai | OPENAI_API_KEY OPENAI_ENDPOINT (opcional) |
Azure OpenAI | azure_openai | CLAVE DE API AZURE_OPENAI_API_KEY AZURE_OPENAI_ENDPOINT AZURE OPENAI |
Búsqueda profunda | deepseek | CLAVE DE API DEEPSEEK_API_KEY PUNTO FINAL DEEPSEEK_ENDPOINT (opcional) |
Géminis | gemini | GOOGLE_API_KEY |
Mistral | mistral | MISTRAL_API_KEY MISTRAL_ENDPOINT (opcional) |
Ollama | ollama | OLLAMA_ENDPOINT (opcional, valor predeterminado localhost:11434) |
OpenRouter | openrouter | CLAVE DE API DE OPENROUTER PUNTO FINAL OPENROUTER_ENDPOINT OPENROUTER_API_KEY (opcional) |
Notas:
- Para los puntos finales marcados como opcionales, se utilizarán los valores predeterminados si no se especifican
- La temperatura se puede configurar usando
MCP_TEMPERATURE
(valor predeterminado: 0,3) - El modelo se puede especificar utilizando
MCP_MODEL_NAME
- Para los modelos Ollama, se pueden configurar configuraciones de contexto adicionales como
num_ctx
ynum_predict
Créditos
Este proyecto amplía la interfaz web y el uso del navegador bajo la licencia MIT. Agradecemos especialmente a los autores originales por su marco de automatización del navegador.
Licencia
MIT - Ver LICENCIA para más detalles.
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Servidor de automatización de navegador impulsado por IA que implementa el Protocolo de contexto de modelo para permitir el control del lenguaje natural de los navegadores web para tareas como navegación, llenado de formularios e interacción visual.
Related MCP Servers
- AsecurityFlicenseAqualityEnables AI agents to interact with web browsers using natural language, featuring automated browsing, form filling, vision-based element detection, and structured JSON responses for systematic browser control.Last updated -146Python
- -securityAlicense-qualityA Model Context Protocol server that enables AI agents to interact with ClickUp workspaces, allowing task creation, management, and workspace organization through natural language commands.Last updated -605MIT License
- -securityFlicense-qualityA web browser automation server that allows AI assistants to control Chrome with persistent state management, enabling complex browsing tasks through asynchronous browser operations.Last updated -1Python
- -security-license-qualityA Model Context Protocol server that enables AI assistants to control Chrome browsers through the Chrome DevTools Protocol, allowing for navigation, clicking, typing, and extracting page information.Last updated -3TypeScript