Skip to main content
Glama

MCP Browser Agent

by ashley-ha

Agente de navegador MCP

Desarrollado en el Hackathon MCP de AGI House

Descripción general

Este proyecto es un agente de automatización de navegadores que utiliza el Protocolo de Contexto de Modelo (MCP) para habilitar las interacciones con el navegador. Proporciona una integración fluida entre Claude y las funciones de automatización de navegadores a través de nuestro servidor MCP.

¡Gracias a Browser-Use por sus capacidades de agente de navegador que ayudan a impulsar nuestro servidor MCP!

Requisitos del sistema

  • macOS (darwin 24.2.0)
  • Python 3.12 o superior
  • administrador de paquetes uv
  • Navegador Google Chrome (asegúrese de que su navegador esté cerrado antes de ejecutar tareas).

Instalación

Instalación mediante herrería

Para instalar automáticamente el Agente de automatización del navegador para Claude Desktop a través de Smithery :

npx -y @smithery/cli install @ashley-ha/mcp-manus --client claude

Instalación manual

  1. Clonar el repositorio:
git clone <repository-url> cd mcp
  1. Configurar el entorno de Python usando uv :
uv venv source .venv/bin/activate uv sync

Configuración

Configuración del escritorio de Claude

Cree o modifique su archivo de configuración de Claude Desktop:

{ "mcpServers": { "browser-use": { "command": "uv", "args": [ "--directory", "/ABSOLUTE/PATH/TO/mcp", "run", "browser-use.py" ] } } }

Reemplace /ABSOLUTE/PATH/TO/browser-use con la ruta absoluta al directorio de su proyecto.

Configuración del navegador

El agente está configurado para utilizar Google Chrome con la siguiente configuración predeterminada:

  • Modo sin cabeza para desarrollo
  • Tamaño de la ventana: 1280x1100
  • Funciones de seguridad deshabilitadas para pruebas
  • Ruta de grabación: ./tmp/recordings

Características

  • Automatización del navegador mediante herramientas MCP
  • Capacidades de gestión y planificación del Estado
  • Detección y manipulación de elementos interactivos
  • Contextos de navegador configurables
  • Soporte de registro y depuración

Uso

El agente proporciona dos herramientas principales:

  1. get_planner_state : recupera el estado actual del navegador y el contexto de planificación
  2. execute_actions : ejecuta acciones planificadas en el navegador

Desarrollo

Explotación florestal

El proyecto utiliza el registro integrado de Python con la siguiente configuración:

  • Todos los registros se dirigen a stderr
  • Formato personalizado: %(levelname)-8s [%(name)s] %(message)s
  • Nivel de registrador raíz: INFO
  • Nivel de registradores de terceros: ADVERTENCIA

Estructura del proyecto

  • browser-use.py : Punto de entrada principal e implementación del servidor
  • tmp/recordings : Directorio para grabaciones de sesiones del navegador
  • Dependencias gestionadas a través de uv

Contribuyendo

Este proyecto se desarrolló durante el Hackathon MCP de AGI House. ¡Agradecemos cualquier contribución!

Licencia

Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.

Derechos de autor (c) 2025 Jaeyun Ha, Ashley Ha

Por la presente se concede permiso, sin cargo, a cualquier persona que obtenga una copia de este software y los archivos de documentación asociados (el "Software"), para tratar el Software sin restricción, incluyendo, sin limitación, los derechos a usar, copiar, modificar, fusionar, publicar, distribuir, sublicenciar y/o vender copias del Software, y para permitir que las personas a quienes se les proporciona el Software lo hagan, sujeto a las siguientes condiciones:

El aviso de derechos de autor anterior y este aviso de permiso se incluirán en todas las copias o partes sustanciales del Software.

EL SOFTWARE SE PROPORCIONA "TAL CUAL", SIN GARANTÍA DE NINGÚN TIPO, EXPRESA O IMPLÍCITA, INCLUYENDO, ENTRE OTRAS, LAS GARANTÍAS DE COMERCIABILIDAD, IDONEIDAD PARA UN FIN DETERMINADO Y NO INFRACCIÓN. EN NINGÚN CASO LOS AUTORES O TITULARES DE LOS DERECHOS DE AUTOR SERÁN RESPONSABLES DE NINGUNA RECLAMACIÓN, DAÑOS U OTRAS RESPONSABILIDADES, YA SEA EN ACCIÓN CONTRACTUAL, EXTRACONTRACTUAL O DE OTRO TIPO, QUE SURJA DE, SE DERIVE DE O EN RELACIÓN CON EL SOFTWARE O EL USO U OTRAS RELACIONES CON EL MISMO.

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Un agente de automatización del navegador que permite a Claude interactuar con los navegadores web a través del Protocolo de contexto de modelo, lo que permite realizar acciones como navegar por sitios web, manipular elementos y administrar el estado del navegador.

  1. Descripción general
    1. Requisitos del sistema
      1. Instalación
        1. Instalación mediante herrería
        2. Instalación manual
      2. Configuración
        1. Configuración del escritorio de Claude
        2. Configuración del navegador
      3. Características
        1. Uso
          1. Desarrollo
            1. Explotación florestal
            2. Estructura del proyecto
          2. Contribuyendo
            1. Licencia

              Related MCP Servers

              • A
                security
                A
                license
                A
                quality
                Facilitates browser automation with custom capabilities and agent-based interactions, integrated through the browser-use library.
                Last updated -
                1
                541
                Python
                MIT License
                • Apple
              • -
                security
                F
                license
                -
                quality
                A web browser automation server that allows AI assistants to control Chrome with persistent state management, enabling complex browsing tasks through asynchronous browser operations.
                Last updated -
                1
                Python
                • Apple
              • -
                security
                A
                license
                -
                quality
                AI-driven browser automation server that implements the Model Context Protocol to enable natural language control of web browsers for tasks like navigation, form filling, and visual interaction.
                Last updated -
                1
                Python
                MIT License
                • Apple
              • -
                security
                -
                license
                -
                quality
                A Model Context Protocol server that enables AI assistants to control Chrome browsers through the Chrome DevTools Protocol, allowing for navigation, clicking, typing, and extracting page information.
                Last updated -
                3
                TypeScript

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/ashley-ha/mcp-manus'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server