Integrations
Connects to Google's Gemini API using the Google API key for AI-driven browser automation tasks
Provides integration with Ollama's local LLM hosting service, supporting customizable context settings and model parameters for browser automation
Integrates with OpenAI's API for LLM functionality, enabling AI-powered browser control with customizable parameters
Servidor MCP que utiliza el navegador
Nota del proyecto : Esta implementación del servidor MCP se basa en la base del uso del navegador y la interfaz web . La lógica principal de automatización del navegador y los patrones de configuración se adaptaron del proyecto original.
Servidor de automatización de navegador impulsado por IA que implementa el Protocolo de contexto de modelo (MCP) para el control del navegador en lenguaje natural.
Características
- 🧠 Integración MCP : implementación completa del protocolo para la comunicación con agentes de IA
- 🌐 Automatización del navegador : navegación de páginas, llenado de formularios e interacción con elementos
- 👁️ Comprensión visual : análisis de capturas de pantalla e interacciones basadas en la visión
- 🔄 Persistencia del estado : mantener las sesiones del navegador entre tareas
- 🔌 Compatibilidad con múltiples LLM : integración con OpenAI, Anthropic, Azure y DeepSeek
Inicio rápido
Prerrequisitos
- Python 3.11 o superior
- uv (instalador rápido de paquetes de Python)
- Navegador Chrome/Chromium
Instalación
Escritorio de Claude
En MacOS: ~/Library/Application\ Support/Claude/claude_desktop_config.json
En Windows: %APPDATA%/Claude/claude_desktop_config.json
Desarrollo local
Desarrollo
Solución de problemas
- Conflictos del navegador : cierre todas las instancias de Chrome antes de comenzar.
- Errores de API : Verifique que las claves de API en las variables de entorno coincidan con su proveedor de LLM.
- Soporte de visión : asegúrese de que
MCP_USE_VISION=true
para el análisis de capturas de pantalla.
Configuración del proveedor
El servidor admite múltiples proveedores LLM mediante variables de entorno. Estas son las opciones disponibles para MCP_MODEL_PROVIDER
:
Proveedor | Valor | Variables de entorno requeridas |
---|---|---|
Antrópico | anthropic | CLAVE DE API ANTHROPIC_API_KEY PUNTO FINAL ANTHROPIC_ENDPOINT (opcional) |
OpenAI | openai | OPENAI_API_KEY OPENAI_ENDPOINT (opcional) |
Azure OpenAI | azure_openai | CLAVE DE API AZURE_OPENAI_API_KEY AZURE_OPENAI_ENDPOINT AZURE OPENAI |
Búsqueda profunda | deepseek | CLAVE DE API DEEPSEEK_API_KEY PUNTO FINAL DEEPSEEK_ENDPOINT (opcional) |
Géminis | gemini | GOOGLE_API_KEY |
Mistral | mistral | MISTRAL_API_KEY MISTRAL_ENDPOINT (opcional) |
Ollama | ollama | OLLAMA_ENDPOINT (opcional, valor predeterminado localhost:11434) |
OpenRouter | openrouter | CLAVE DE API DE OPENROUTER PUNTO FINAL OPENROUTER_ENDPOINT OPENROUTER_API_KEY (opcional) |
Notas:
- Para los puntos finales marcados como opcionales, se utilizarán los valores predeterminados si no se especifican
- La temperatura se puede configurar usando
MCP_TEMPERATURE
(valor predeterminado: 0,3) - El modelo se puede especificar utilizando
MCP_MODEL_NAME
- Para los modelos Ollama, se pueden configurar configuraciones de contexto adicionales como
num_ctx
ynum_predict
Créditos
Este proyecto amplía la interfaz web y el uso del navegador bajo la licencia MIT. Agradecemos especialmente a los autores originales por su marco de automatización del navegador.
Licencia
MIT - Ver LICENCIA para más detalles.
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Servidor de automatización de navegador impulsado por IA que implementa el Protocolo de contexto de modelo para permitir el control del lenguaje natural de los navegadores web para tareas como navegación, llenado de formularios e interacción visual.