MCP 브라우저 에이전트
AGI House MCP 해커톤에서 제작
개요
이 프로젝트는 모델 컨텍스트 프로토콜(MCP)을 사용하여 브라우저 상호작용을 지원하는 브라우저 자동화 에이전트입니다. MCP 서버를 통해 Claude와 브라우저 자동화 기능을 원활하게 통합합니다.
MCP 서버를 구동하는 데 도움이 되는 브라우저 에이전트 기능을 제공해 준 Browser-Use에 감사드립니다!
시스템 요구 사항
- macOS(다윈 24.2.0)
- Python 3.12 이상
uv
패키지 관리자- Google Chrome 브라우저(작업을 실행하기 전에 브라우저를 닫아두세요.)
설치
Smithery를 통해 설치
Smithery를 통해 Claude Desktop용 브라우저 자동화 에이전트를 자동으로 설치하려면:
지엑스피1
수동 설치
- 저장소를 복제합니다.
uv
사용하여 Python 환경을 설정합니다.
구성
클로드 데스크톱 구성
Claude Desktop 구성 파일을 만들거나 수정하세요.
/ABSOLUTE/PATH/TO/browser-use
프로젝트 디렉토리의 절대 경로로 바꾸세요.
브라우저 구성
에이전트는 다음 기본 설정으로 Google Chrome을 사용하도록 구성되어 있습니다.
- 개발을 위한 비헤드리스 모드
- 창 크기: 1280x1100
- 테스트를 위한 보안 기능 비활성화
- 녹음 경로: ./tmp/recordings
특징
- MCP 도구를 통한 브라우저 자동화
- 국가 관리 및 계획 역량
- 대화형 요소 감지 및 조작
- 구성 가능한 브라우저 컨텍스트
- 로깅 및 디버깅 지원
용법
에이전트는 두 가지 주요 도구를 제공합니다.
get_planner_state
: 현재 브라우저 상태 및 계획 컨텍스트를 검색합니다.execute_actions
: 브라우저에서 계획된 작업을 실행합니다.
개발
벌채 반출
이 프로젝트는 다음 구성을 사용하여 Python의 내장 로깅을 사용합니다.
- 모든 로그는 stderr로 전송됩니다.
- 사용자 지정 서식:
%(levelname)-8s [%(name)s] %(message)s
- 루트 로거 레벨: INFO
- 타사 로거 수준: 경고
프로젝트 구조
browser-use.py
: 주요 진입점 및 서버 구현tmp/recordings
: 브라우저 세션 녹음을 위한 디렉토리uv
통해 관리되는 종속성
기여하다
이 프로젝트는 AGI House MCP 해커톤 기간 동안 진행되었습니다. 여러분의 참여를 환영합니다!
특허
이 프로젝트는 MIT 라이선스에 따라 라이선스가 부여되었습니다. 자세한 내용은 라이선스 파일을 참조하세요.
Copyright (c) 2025 하재윤, 하애슐리
본 소프트웨어 및 관련 문서 파일(이하 "소프트웨어")의 사본을 취득한 모든 사람에게 소프트웨어를 제한 없이 거래할 수 있는 권한을 무상으로 부여합니다. 여기에는 소프트웨어 사본을 사용, 복사, 수정, 병합, 게시, 배포, 하위 라이선스 및/또는 판매할 수 있는 권한이 포함되나 이에 국한되지 않으며, 소프트웨어가 제공된 사람에게도 이러한 권한을 부여합니다. 단, 다음 조건에 따라야 합니다.
위의 저작권 고지와 본 허가 고지는 소프트웨어의 모든 사본 또는 실질적인 부분에 포함되어야 합니다.
본 소프트웨어는 상품성, 특정 목적 적합성 및 비침해에 대한 보증을 포함하되 이에 국한되지 않는 명시적 또는 묵시적 보증 없이 "있는 그대로" 제공됩니다. 어떠한 경우에도 저작자 또는 저작권자는 본 소프트웨어 또는 본 소프트웨어의 사용 또는 기타 거래와 관련하여 발생하는 계약, 불법 행위 또는 기타 소송을 포함한 모든 청구, 손해 또는 기타 책임에 대해 책임을 지지 않습니다.
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Claude가 Model Context Protocol을 통해 웹 브라우저와 상호 작용할 수 있도록 하는 브라우저 자동화 에이전트로, 웹사이트 탐색, 요소 조작, 브라우저 상태 관리 등의 작업이 가능합니다.
Related MCP Servers
- AsecurityAlicenseAqualityFacilitates browser automation with custom capabilities and agent-based interactions, integrated through the browser-use library.Last updated -1541PythonMIT License
- -securityFlicense-qualityA web browser automation server that allows AI assistants to control Chrome with persistent state management, enabling complex browsing tasks through asynchronous browser operations.Last updated -1Python
- -securityAlicense-qualityAI-driven browser automation server that implements the Model Context Protocol to enable natural language control of web browsers for tasks like navigation, form filling, and visual interaction.Last updated -1PythonMIT License
- -security-license-qualityA Model Context Protocol server that enables AI assistants to control Chrome browsers through the Chrome DevTools Protocol, allowing for navigation, clicking, typing, and extracting page information.Last updated -3TypeScript