MCP 浏览器代理
在 AGI House MCP Hackathon 建造
概述
该项目是一个浏览器自动化代理,它使用模型上下文协议 (MCP) 来实现浏览器交互。它通过我们的 MCP 服务器实现了 Claude 与浏览器自动化功能的无缝集成。
感谢 Browser-Use 的浏览器代理功能,为我们的 MCP 服务器提供支持!
系统要求
- macOS(达尔文 24.2.0)
- Python 3.12 或更高版本
uv
包管理器- Google Chrome 浏览器(运行任务之前请确保浏览器已关闭。)
安装
通过 Smithery 安装
要通过Smithery自动安装 Claude Desktop 的浏览器自动化代理:
手动安装
- 克隆存储库:
- 使用
uv
设置 Python 环境:
配置
Claude桌面配置
创建或修改您的 Claude Desktop 配置文件:
将/ABSOLUTE/PATH/TO/browser-use
替换为项目目录的绝对路径。
浏览器配置
该代理配置为使用 Google Chrome,具有以下默认设置:
- 用于开发的非无头模式
- 窗口大小:1280x1100
- 禁用安全功能以进行测试
- 录音路径:./tmp/recordings
特征
- 通过 MCP 工具实现浏览器自动化
- 国家管理和规划能力
- 交互元素检测和操作
- 可配置的浏览器上下文
- 日志记录和调试支持
用法
该代理提供两个主要工具:
get_planner_state
:检索当前浏览器状态和规划上下文execute_actions
浏览器中计划的操作
发展
日志记录
该项目使用 Python 的内置日志记录,其配置如下:
- 所有日志都指向 stderr
- 自定义格式:
%(levelname)-8s [%(name)s] %(message)s
- 根记录器级别:INFO
- 第三方记录器级别:警告
项目结构
browser-use.py
:主入口点和服务器实现tmp/recordings
:浏览器会话记录的目录- 通过
uv
管理依赖项
贡献
该项目是在 AGI House MCP Hackathon 期间构建的。欢迎贡献!
执照
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅LICENSE文件。
版权所有 (c) 2025 Jaeyun Ha、Ashley Ha
特此授予获得此软件和相关文档文件(“软件”)副本的任何人免费许可,以无限制方式处理软件,包括但不限于使用、复制、修改、合并、发布、分发、再授权和/或销售软件副本的权利,并允许向其提供软件的人员这样做,但须遵守以下条件:
上述版权声明和本许可声明均应包含在软件的所有副本或实质性部分中。
本软件按“原样”提供,不附带任何形式的明示或暗示保证,包括但不限于适销性、适用于特定用途和非侵权性的保证。在任何情况下,作者或版权所有者均不对因本软件或使用或以其他方式处理本软件而引起的或与之相关的任何索赔、损害或其他责任承担责任,无论是合同、侵权或其他诉讼。
Related MCP Servers
- AsecurityAlicenseAqualityFacilitates browser automation with custom capabilities and agent-based interactions, integrated through the browser-use library.Last updated -1541PythonMIT License
- -securityFlicense-qualityA web browser automation server that allows AI assistants to control Chrome with persistent state management, enabling complex browsing tasks through asynchronous browser operations.Last updated -1Python
- -securityAlicense-qualityAI-driven browser automation server that implements the Model Context Protocol to enable natural language control of web browsers for tasks like navigation, form filling, and visual interaction.Last updated -1PythonMIT License
- -security-license-qualityA Model Context Protocol server that enables AI assistants to control Chrome browsers through the Chrome DevTools Protocol, allowing for navigation, clicking, typing, and extracting page information.Last updated -3TypeScript