local-only server
The server can only run on the client’s local machine because it depends on local resources.
Integrations
Supports GitHub as an LLM provider through API key integration
Allows executing JavaScript code on webpages through the 'execute_js' operation
Supports Ollama as an LLM provider through API key integration
브라우저 사용 서버
Python 스크립트를 사용한 브라우저 자동화를 위한 모델 컨텍스트 프로토콜 서버입니다. Cline과 함께 사용 가능
특징
브라우저 작업
screenshot
: 웹페이지(전체 페이지 또는 뷰포트)의 스크린샷을 캡처합니다.get_html
: 웹페이지의 HTML 콘텐츠를 검색합니다execute_js
: 웹페이지에서 JavaScript 실행get_console_logs
: 웹페이지에서 콘솔 로그를 가져옵니다.
모든 작업은 페이지 로드 후 사용자 지정 상호작용 단계(예: 요소 클릭, 스크롤)를 지원합니다.
필수 조건
- (선택 사항이지만 권장됨) 헤드리스 브라우저 자동화를 위해 Xvfb를 설치하세요.
지엑스피1
Xvfb(X Virtual Frame Buffer)는 가상 디스플레이를 생성하여 봇으로 감지되지 않고 브라우저 자동화를 가능하게 합니다. Xvfb에 대한 자세한 내용은 여기를 참조하세요.
- Miniconda 또는 Anaconda 설치
- Conda 환경을 만듭니다.
- LLM 구성 설정:
이 서버는 여러 LLM 공급자를 지원합니다. 다음 API 키를 사용할 수 있습니다.
서버는 자동으로 찾은 첫 번째 사용 가능한 API 키를 사용합니다. 환경 변수를 사용하여 모든 공급자의 모델과 기본 URL을 사용자 지정할 수 있습니다.
설치
Smithery를 통해 설치
Smithery를 통해 Claude Desktop용 Browser Use Server를 자동으로 설치하려면:
- 이 저장소를 복제하세요
- 종속성 설치:
- 서버를 빌드하세요:
MCP 구성
Cline MCP 설정에 다음 구성을 추가하세요.
바꾸다:
YOUR_HOME
실제 홈 디렉토리 이름으로 변경- 실제 API 키와
your_api_key
함께 사용하세요
용법
서버를 실행합니다:
서버는 stdio에서 사용할 수 있으며 다음 작업을 지원합니다.
스크린샷
매개변수:
- url: 웹페이지 URL(필수)
- full_page: 전체 페이지를 캡처할지 아니면 뷰포트만 캡처할지 여부(선택 사항, 기본값: false)
- steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)
HTML 가져오기
매개변수:
- url: 웹페이지 URL(필수)
- steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)
JavaScript 실행
매개변수:
- url: 웹페이지 URL(필수)
- 스크립트: 실행할 JavaScript 코드(필수)
- steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)
콘솔 로그 가져오기
매개변수:
- url: 웹페이지 URL(필수)
- steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)
클라인 사용 예시
다음은 Cline과 함께 브라우저 사용 서버를 사용하여 수행할 수 있는 몇 가지 작업의 예입니다.
개발 중 웹 페이지 요소 수정
인증이 필요한 페이지에서 제목의 색상을 변경하려면:
이 작업에서는 다음 사항을 보여줍니다.
- 쉼표로 구분된 단계를 사용한 다단계 브라우저 자동화
- 인증 처리
- 쿠키 수락
- DOM 조작
- CSS 스타일 변경
서버는 이러한 단계를 순차적으로 실행하면서 그 과정에서 필요한 상호작용을 처리합니다.
구성
LLM 구성
서버는 기본 구성을 사용하여 여러 LLM 공급자를 지원합니다.
- GLHF: deepseek-ai/DeepSeek-V3 모델을 사용합니다.
- Ollama: 32k 컨텍스트 창을 사용하는 qwen2.5:32b-instruct-q4_K_M 모델을 사용합니다.
- Groq: deepseek-r1-distill-llama-70b 모델을 사용합니다.
- OpenAI: gpt-4o-mini 모델을 사용합니다.
- Openrouter: deepseek/deepseek-chat 모델을 사용합니다.
- Github: gpt-4o-mini 모델 사용
- DeepSeek: deepseek-chat 모델을 사용합니다
- Gemini: gemini-2.0-flash-exp 모델을 사용합니다.
환경 변수를 사용하여 이러한 기본값을 재정의할 수 있습니다.
MODEL
: 모든 공급자에 대한 사용자 정의 모델 이름 설정BASE_URL
: 사용자 정의 API 엔드포인트 URL을 설정합니다(공급자가 지원하는 경우)
비전 지원
서버는 USE_VISION 환경 변수를 통해 비전 기능을 지원합니다.
- 브라우저 작업에 대한 비전 기능을 활성화하려면 USE_VISION=true를 설정합니다.
- 비전이 필요하지 않을 때 성능을 최적화하기 위해 기본값은 false입니다.
- 웹 페이지 콘텐츠의 시각적 이해가 필요한 작업에 유용합니다.
Xvfb 지원
서버는 Xvfb가 설치되어 있는지 자동으로 감지합니다.
- 사용 가능한 경우 xvfb-run을 사용하여 봇 감지 없이 더 나은 브라우저 자동화를 활성화합니다.
- Xvfb가 설치되지 않은 경우 직접 실행으로 돌아갑니다.
- RUNNING_UNDER_XVFB 환경 변수를 적절히 설정합니다.
타임아웃
기본 제한 시간은 5분(300000ms)입니다. build/index.js
파일의 TIMEOUT 상수를 수정하여 이 값을 변경하세요.
오류 처리
서버는 다음에 대한 자세한 오류 메시지를 제공합니다.
- Python 스크립트 실행 실패
- 브라우저 작업 시간 초과
- 잘못된 매개변수
디버깅
디버깅을 위해 MCP Inspector를 사용하세요.
소환
특허
MIT
You must be authenticated.
Python 스크립트를 사용하여 브라우저 자동화를 활성화하고, 웹페이지 스크린샷 찍기, HTML 콘텐츠 검색, JavaScript 실행과 같은 작업을 제공합니다.
- Features
- Prerequisites
- Installation
- MCP Configuration
- Usage
- Example Cline Usage
- Configuration
- Error Handling
- Debugging
- Citation
- License