Agente de navegador MCP
Desarrollado en el Hackathon MCP de AGI House
Descripción general
Este proyecto es un agente de automatización de navegadores que utiliza el Protocolo de Contexto de Modelo (MCP) para habilitar las interacciones con el navegador. Proporciona una integración fluida entre Claude y las funciones de automatización de navegadores a través de nuestro servidor MCP.
¡Gracias a Browser-Use por sus capacidades de agente de navegador que ayudan a impulsar nuestro servidor MCP!
Requisitos del sistema
- macOS (darwin 24.2.0)
- Python 3.12 o superior
- administrador de paquetes
uv
- Navegador Google Chrome (asegúrese de que su navegador esté cerrado antes de ejecutar tareas).
Instalación
Instalación mediante herrería
Para instalar automáticamente el Agente de automatización del navegador para Claude Desktop a través de Smithery :
Instalación manual
- Clonar el repositorio:
- Configurar el entorno de Python usando
uv
:
Configuración
Configuración del escritorio de Claude
Cree o modifique su archivo de configuración de Claude Desktop:
Reemplace /ABSOLUTE/PATH/TO/browser-use
con la ruta absoluta al directorio de su proyecto.
Configuración del navegador
El agente está configurado para utilizar Google Chrome con la siguiente configuración predeterminada:
- Modo sin cabeza para desarrollo
- Tamaño de la ventana: 1280x1100
- Funciones de seguridad deshabilitadas para pruebas
- Ruta de grabación: ./tmp/recordings
Características
- Automatización del navegador mediante herramientas MCP
- Capacidades de gestión y planificación del Estado
- Detección y manipulación de elementos interactivos
- Contextos de navegador configurables
- Soporte de registro y depuración
Uso
El agente proporciona dos herramientas principales:
get_planner_state
: recupera el estado actual del navegador y el contexto de planificaciónexecute_actions
: ejecuta acciones planificadas en el navegador
Desarrollo
Explotación florestal
El proyecto utiliza el registro integrado de Python con la siguiente configuración:
- Todos los registros se dirigen a stderr
- Formato personalizado:
%(levelname)-8s [%(name)s] %(message)s
- Nivel de registrador raíz: INFO
- Nivel de registradores de terceros: ADVERTENCIA
Estructura del proyecto
browser-use.py
: Punto de entrada principal e implementación del servidortmp/recordings
: Directorio para grabaciones de sesiones del navegador- Dependencias gestionadas a través de
uv
Contribuyendo
Este proyecto se desarrolló durante el Hackathon MCP de AGI House. ¡Agradecemos cualquier contribución!
Licencia
Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.
Derechos de autor (c) 2025 Jaeyun Ha, Ashley Ha
Por la presente se concede permiso, sin cargo, a cualquier persona que obtenga una copia de este software y los archivos de documentación asociados (el "Software"), para tratar el Software sin restricción, incluyendo, sin limitación, los derechos a usar, copiar, modificar, fusionar, publicar, distribuir, sublicenciar y/o vender copias del Software, y para permitir que las personas a quienes se les proporciona el Software lo hagan, sujeto a las siguientes condiciones:
El aviso de derechos de autor anterior y este aviso de permiso se incluirán en todas las copias o partes sustanciales del Software.
EL SOFTWARE SE PROPORCIONA "TAL CUAL", SIN GARANTÍA DE NINGÚN TIPO, EXPRESA O IMPLÍCITA, INCLUYENDO, ENTRE OTRAS, LAS GARANTÍAS DE COMERCIABILIDAD, IDONEIDAD PARA UN FIN DETERMINADO Y NO INFRACCIÓN. EN NINGÚN CASO LOS AUTORES O TITULARES DE LOS DERECHOS DE AUTOR SERÁN RESPONSABLES DE NINGUNA RECLAMACIÓN, DAÑOS U OTRAS RESPONSABILIDADES, YA SEA EN ACCIÓN CONTRACTUAL, EXTRACONTRACTUAL O DE OTRO TIPO, QUE SURJA DE, SE DERIVE DE O EN RELACIÓN CON EL SOFTWARE O EL USO U OTRAS RELACIONES CON EL MISMO.
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Un agente de automatización del navegador que permite a Claude interactuar con los navegadores web a través del Protocolo de contexto de modelo, lo que permite realizar acciones como navegar por sitios web, manipular elementos y administrar el estado del navegador.
Related MCP Servers
- AsecurityAlicenseAqualityFacilitates browser automation with custom capabilities and agent-based interactions, integrated through the browser-use library.Last updated -1541PythonMIT License
- -securityFlicense-qualityA web browser automation server that allows AI assistants to control Chrome with persistent state management, enabling complex browsing tasks through asynchronous browser operations.Last updated -1Python
- -securityAlicense-qualityAI-driven browser automation server that implements the Model Context Protocol to enable natural language control of web browsers for tasks like navigation, form filling, and visual interaction.Last updated -1PythonMIT License
- -security-license-qualityA Model Context Protocol server that enables AI assistants to control Chrome browsers through the Chrome DevTools Protocol, allowing for navigation, clicking, typing, and extracting page information.Last updated -3TypeScript