Integrations
Provides automated browser interaction within Google Chrome, allowing for element detection, navigation, and state management in web applications
Supports browser automation on macOS systems with specific compatibility for darwin 24.2.0
Agente de navegador MCP
Desarrollado en el Hackathon MCP de AGI House
Descripción general
Este proyecto es un agente de automatización de navegadores que utiliza el Protocolo de Contexto de Modelo (MCP) para habilitar las interacciones con el navegador. Proporciona una integración fluida entre Claude y las funciones de automatización de navegadores a través de nuestro servidor MCP.
¡Gracias a Browser-Use por sus capacidades de agente de navegador que ayudan a impulsar nuestro servidor MCP!
Requisitos del sistema
- macOS (darwin 24.2.0)
- Python 3.12 o superior
- administrador de paquetes
uv
- Navegador Google Chrome (asegúrese de que su navegador esté cerrado antes de ejecutar tareas).
Instalación
Instalación mediante herrería
Para instalar automáticamente el Agente de automatización del navegador para Claude Desktop a través de Smithery :
Instalación manual
- Clonar el repositorio:
- Configurar el entorno de Python usando
uv
:
Configuración
Configuración del escritorio de Claude
Cree o modifique su archivo de configuración de Claude Desktop:
Reemplace /ABSOLUTE/PATH/TO/browser-use
con la ruta absoluta al directorio de su proyecto.
Configuración del navegador
El agente está configurado para utilizar Google Chrome con la siguiente configuración predeterminada:
- Modo sin cabeza para desarrollo
- Tamaño de la ventana: 1280x1100
- Funciones de seguridad deshabilitadas para pruebas
- Ruta de grabación: ./tmp/recordings
Características
- Automatización del navegador mediante herramientas MCP
- Capacidades de gestión y planificación del Estado
- Detección y manipulación de elementos interactivos
- Contextos de navegador configurables
- Soporte de registro y depuración
Uso
El agente proporciona dos herramientas principales:
get_planner_state
: recupera el estado actual del navegador y el contexto de planificaciónexecute_actions
: ejecuta acciones planificadas en el navegador
Desarrollo
Explotación florestal
El proyecto utiliza el registro integrado de Python con la siguiente configuración:
- Todos los registros se dirigen a stderr
- Formato personalizado:
%(levelname)-8s [%(name)s] %(message)s
- Nivel de registrador raíz: INFO
- Nivel de registradores de terceros: ADVERTENCIA
Estructura del proyecto
browser-use.py
: Punto de entrada principal e implementación del servidortmp/recordings
: Directorio para grabaciones de sesiones del navegador- Dependencias gestionadas a través de
uv
Contribuyendo
Este proyecto se desarrolló durante el Hackathon MCP de AGI House. ¡Agradecemos cualquier contribución!
Licencia
Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.
Derechos de autor (c) 2025 Jaeyun Ha, Ashley Ha
Por la presente se concede permiso, sin cargo, a cualquier persona que obtenga una copia de este software y los archivos de documentación asociados (el "Software"), para tratar el Software sin restricción, incluyendo, sin limitación, los derechos a usar, copiar, modificar, fusionar, publicar, distribuir, sublicenciar y/o vender copias del Software, y para permitir que las personas a quienes se les proporciona el Software lo hagan, sujeto a las siguientes condiciones:
El aviso de derechos de autor anterior y este aviso de permiso se incluirán en todas las copias o partes sustanciales del Software.
EL SOFTWARE SE PROPORCIONA "TAL CUAL", SIN GARANTÍA DE NINGÚN TIPO, EXPRESA O IMPLÍCITA, INCLUYENDO, ENTRE OTRAS, LAS GARANTÍAS DE COMERCIABILIDAD, IDONEIDAD PARA UN FIN DETERMINADO Y NO INFRACCIÓN. EN NINGÚN CASO LOS AUTORES O TITULARES DE LOS DERECHOS DE AUTOR SERÁN RESPONSABLES DE NINGUNA RECLAMACIÓN, DAÑOS U OTRAS RESPONSABILIDADES, YA SEA EN ACCIÓN CONTRACTUAL, EXTRACONTRACTUAL O DE OTRO TIPO, QUE SURJA DE, SE DERIVE DE O EN RELACIÓN CON EL SOFTWARE O EL USO U OTRAS RELACIONES CON EL MISMO.
This server cannot be installed
Un agente de automatización del navegador que permite a Claude interactuar con los navegadores web a través del Protocolo de contexto de modelo, lo que permite realizar acciones como navegar por sitios web, manipular elementos y administrar el estado del navegador.