MCP Browser Agent

MIT License
2
  • Apple

Integrations

  • Provides automated browser interaction within Google Chrome, allowing for element detection, navigation, and state management in web applications

  • Supports browser automation on macOS systems with specific compatibility for darwin 24.2.0

Agente de navegador MCP

Desarrollado en el Hackathon MCP de AGI House

Descripción general

Este proyecto es un agente de automatización de navegadores que utiliza el Protocolo de Contexto de Modelo (MCP) para habilitar las interacciones con el navegador. Proporciona una integración fluida entre Claude y las funciones de automatización de navegadores a través de nuestro servidor MCP.

¡Gracias a Browser-Use por sus capacidades de agente de navegador que ayudan a impulsar nuestro servidor MCP!

Requisitos del sistema

  • macOS (darwin 24.2.0)
  • Python 3.12 o superior
  • administrador de paquetes uv
  • Navegador Google Chrome (asegúrese de que su navegador esté cerrado antes de ejecutar tareas).

Instalación

Instalación mediante herrería

Para instalar automáticamente el Agente de automatización del navegador para Claude Desktop a través de Smithery :

npx -y @smithery/cli install @ashley-ha/mcp-manus --client claude

Instalación manual

  1. Clonar el repositorio:
git clone <repository-url> cd mcp
  1. Configurar el entorno de Python usando uv :
uv venv source .venv/bin/activate uv sync

Configuración

Configuración del escritorio de Claude

Cree o modifique su archivo de configuración de Claude Desktop:

{ "mcpServers": { "browser-use": { "command": "uv", "args": [ "--directory", "/ABSOLUTE/PATH/TO/mcp", "run", "browser-use.py" ] } } }

Reemplace /ABSOLUTE/PATH/TO/browser-use con la ruta absoluta al directorio de su proyecto.

Configuración del navegador

El agente está configurado para utilizar Google Chrome con la siguiente configuración predeterminada:

  • Modo sin cabeza para desarrollo
  • Tamaño de la ventana: 1280x1100
  • Funciones de seguridad deshabilitadas para pruebas
  • Ruta de grabación: ./tmp/recordings

Características

  • Automatización del navegador mediante herramientas MCP
  • Capacidades de gestión y planificación del Estado
  • Detección y manipulación de elementos interactivos
  • Contextos de navegador configurables
  • Soporte de registro y depuración

Uso

El agente proporciona dos herramientas principales:

  1. get_planner_state : recupera el estado actual del navegador y el contexto de planificación
  2. execute_actions : ejecuta acciones planificadas en el navegador

Desarrollo

Explotación florestal

El proyecto utiliza el registro integrado de Python con la siguiente configuración:

  • Todos los registros se dirigen a stderr
  • Formato personalizado: %(levelname)-8s [%(name)s] %(message)s
  • Nivel de registrador raíz: INFO
  • Nivel de registradores de terceros: ADVERTENCIA

Estructura del proyecto

  • browser-use.py : Punto de entrada principal e implementación del servidor
  • tmp/recordings : Directorio para grabaciones de sesiones del navegador
  • Dependencias gestionadas a través de uv

Contribuyendo

Este proyecto se desarrolló durante el Hackathon MCP de AGI House. ¡Agradecemos cualquier contribución!

Licencia

Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.

Derechos de autor (c) 2025 Jaeyun Ha, Ashley Ha

Por la presente se concede permiso, sin cargo, a cualquier persona que obtenga una copia de este software y los archivos de documentación asociados (el "Software"), para tratar el Software sin restricción, incluyendo, sin limitación, los derechos a usar, copiar, modificar, fusionar, publicar, distribuir, sublicenciar y/o vender copias del Software, y para permitir que las personas a quienes se les proporciona el Software lo hagan, sujeto a las siguientes condiciones:

El aviso de derechos de autor anterior y este aviso de permiso se incluirán en todas las copias o partes sustanciales del Software.

EL SOFTWARE SE PROPORCIONA "TAL CUAL", SIN GARANTÍA DE NINGÚN TIPO, EXPRESA O IMPLÍCITA, INCLUYENDO, ENTRE OTRAS, LAS GARANTÍAS DE COMERCIABILIDAD, IDONEIDAD PARA UN FIN DETERMINADO Y NO INFRACCIÓN. EN NINGÚN CASO LOS AUTORES O TITULARES DE LOS DERECHOS DE AUTOR SERÁN RESPONSABLES DE NINGUNA RECLAMACIÓN, DAÑOS U OTRAS RESPONSABILIDADES, YA SEA EN ACCIÓN CONTRACTUAL, EXTRACONTRACTUAL O DE OTRO TIPO, QUE SURJA DE, SE DERIVE DE O EN RELACIÓN CON EL SOFTWARE O EL USO U OTRAS RELACIONES CON EL MISMO.

-
security - not tested
A
license - permissive license
-
quality - not tested

Un agente de automatización del navegador que permite a Claude interactuar con los navegadores web a través del Protocolo de contexto de modelo, lo que permite realizar acciones como navegar por sitios web, manipular elementos y administrar el estado del navegador.

  1. Overview
    1. System Requirements
      1. Installation
        1. Installing via Smithery
        2. Manual Installation
      2. Configuration
        1. Claude Desktop Configuration
        2. Browser Configuration
      3. Features
        1. Usage
          1. Development
            1. Logging
            2. Project Structure
          2. Contributing
            1. License
              ID: 8c4hi61i1a