Agente de navegador MCP
Desarrollado en el Hackathon MCP de AGI House
Descripción general
Este proyecto es un agente de automatización de navegadores que utiliza el Protocolo de Contexto de Modelo (MCP) para habilitar las interacciones con el navegador. Proporciona una integración fluida entre Claude y las funciones de automatización de navegadores a través de nuestro servidor MCP.
¡Gracias a Browser-Use por sus capacidades de agente de navegador que ayudan a impulsar nuestro servidor MCP!
Requisitos del sistema
macOS (darwin 24.2.0)
Python 3.12 o superior
administrador de paquetes
uvNavegador Google Chrome (asegúrese de que su navegador esté cerrado antes de ejecutar tareas).
Instalación
Instalación mediante herrería
Para instalar automáticamente el Agente de automatización del navegador para Claude Desktop a través de Smithery :
Instalación manual
Clonar el repositorio:
Configurar el entorno de Python usando
uv:
Configuración
Configuración del escritorio de Claude
Cree o modifique su archivo de configuración de Claude Desktop:
Reemplace /ABSOLUTE/PATH/TO/browser-use con la ruta absoluta al directorio de su proyecto.
Configuración del navegador
El agente está configurado para utilizar Google Chrome con la siguiente configuración predeterminada:
Modo sin cabeza para desarrollo
Tamaño de la ventana: 1280x1100
Funciones de seguridad deshabilitadas para pruebas
Ruta de grabación: ./tmp/recordings
Características
Automatización del navegador mediante herramientas MCP
Capacidades de gestión y planificación del Estado
Detección y manipulación de elementos interactivos
Contextos de navegador configurables
Soporte de registro y depuración
Uso
El agente proporciona dos herramientas principales:
get_planner_state: recupera el estado actual del navegador y el contexto de planificaciónexecute_actions: ejecuta acciones planificadas en el navegador
Desarrollo
Explotación florestal
El proyecto utiliza el registro integrado de Python con la siguiente configuración:
Todos los registros se dirigen a stderr
Formato personalizado:
%(levelname)-8s [%(name)s] %(message)sNivel de registrador raíz: INFO
Nivel de registradores de terceros: ADVERTENCIA
Estructura del proyecto
browser-use.py: Punto de entrada principal e implementación del servidortmp/recordings: Directorio para grabaciones de sesiones del navegadorDependencias gestionadas a través de
uv
Contribuyendo
Este proyecto se desarrolló durante el Hackathon MCP de AGI House. ¡Agradecemos cualquier contribución!
Licencia
Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.
Derechos de autor (c) 2025 Jaeyun Ha, Ashley Ha
Por la presente se concede permiso, sin cargo, a cualquier persona que obtenga una copia de este software y los archivos de documentación asociados (el "Software"), para tratar el Software sin restricción, incluyendo, sin limitación, los derechos a usar, copiar, modificar, fusionar, publicar, distribuir, sublicenciar y/o vender copias del Software, y para permitir que las personas a quienes se les proporciona el Software lo hagan, sujeto a las siguientes condiciones:
El aviso de derechos de autor anterior y este aviso de permiso se incluirán en todas las copias o partes sustanciales del Software.
EL SOFTWARE SE PROPORCIONA "TAL CUAL", SIN GARANTÍA DE NINGÚN TIPO, EXPRESA O IMPLÍCITA, INCLUYENDO, ENTRE OTRAS, LAS GARANTÍAS DE COMERCIABILIDAD, IDONEIDAD PARA UN FIN DETERMINADO Y NO INFRACCIÓN. EN NINGÚN CASO LOS AUTORES O TITULARES DE LOS DERECHOS DE AUTOR SERÁN RESPONSABLES DE NINGUNA RECLAMACIÓN, DAÑOS U OTRAS RESPONSABILIDADES, YA SEA EN ACCIÓN CONTRACTUAL, EXTRACONTRACTUAL O DE OTRO TIPO, QUE SURJA DE, SE DERIVE DE O EN RELACIÓN CON EL SOFTWARE O EL USO U OTRAS RELACIONES CON EL MISMO.
local-only server
The server can only run on the client's local machine because it depends on local resources.
Un agente de automatización del navegador que permite a Claude interactuar con los navegadores web a través del Protocolo de contexto de modelo, lo que permite realizar acciones como navegar por sitios web, manipular elementos y administrar el estado del navegador.
Related MCP Servers
- -security-license-qualityA comprehensive suite of Model Context Protocol servers designed to extend AI agent Claude's capabilities with integrations for knowledge management, reasoning, advanced search, news access, and workspace tools.Last updated -5
302AI BrowserUse MCP Serverofficial
Asecurity-licenseAqualityA Model Context Protocol server that enables Claude Desktop to browse the web, likely allowing the AI to access and interact with web content.Last updated -2308MIT License- TypeScriptMozilla Public License 2.0
- -security-license-qualityA server implementation that enables controlling web browsers programmatically through Claude's desktop application, providing comprehensive Selenium WebDriver operations for browser automation with Chrome and Firefox support.Last updated -3MIT License