Browser Use Server

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Supports GitHub as an LLM provider through API key integration

  • Allows executing JavaScript code on webpages through the 'execute_js' operation

  • Supports Ollama as an LLM provider through API key integration

브라우저 사용 서버

Python 스크립트를 사용한 브라우저 자동화를 위한 모델 컨텍스트 프로토콜 서버입니다. Cline과 함께 사용 가능

특징

브라우저 작업

  • screenshot : 웹페이지(전체 페이지 또는 뷰포트)의 스크린샷을 캡처합니다.
  • get_html : 웹페이지의 HTML 콘텐츠를 검색합니다
  • execute_js : 웹페이지에서 JavaScript 실행
  • get_console_logs : 웹페이지에서 콘솔 로그를 가져옵니다.

모든 작업은 페이지 로드 후 사용자 지정 상호작용 단계(예: 요소 클릭, 스크롤)를 지원합니다.

필수 조건

  1. (선택 사항이지만 권장됨) 헤드리스 브라우저 자동화를 위해 Xvfb를 설치하세요.

지엑스피1

Xvfb(X Virtual Frame Buffer)는 가상 디스플레이를 생성하여 봇으로 감지되지 않고 브라우저 자동화를 가능하게 합니다. Xvfb에 대한 자세한 내용은 여기를 참조하세요.

  1. Miniconda 또는 Anaconda 설치
  2. Conda 환경을 만듭니다.
conda create -n browser-use python=3.11 conda activate browser-use pip install browser-use
  1. LLM 구성 설정:

이 서버는 여러 LLM 공급자를 지원합니다. 다음 API 키를 사용할 수 있습니다.

# Required: Set at least one of these API keys export GLHF_API_KEY=your_api_key export GROQ_API_KEY=your_api_key export OPENAI_API_KEY=your_api_key export OPENROUTER_API_KEY=your_api_key export GITHUB_API_KEY=your_api_key export DEEPSEEK_API_KEY=your_api_key export GEMINI_API_KEY=your_api_key export OLLAMA_API_KEY=your_api_key # Optional: Override default configuration export MODEL=your_preferred_model # Override the default model export BASE_URL=your_custom_url # Override the default API endpoint export USE_VISION=false # Enable/disable vision capabilities (default: false)

서버는 자동으로 찾은 첫 번째 사용 가능한 API 키를 사용합니다. 환경 변수를 사용하여 모든 공급자의 모델과 기본 URL을 사용자 지정할 수 있습니다.

설치

Smithery를 통해 설치

Smithery를 통해 Claude Desktop용 Browser Use Server를 자동으로 설치하려면:

npx -y @smithery/cli install @ztobs/cline-browser-use-mcp --client claude
  1. 이 저장소를 복제하세요
  2. 종속성 설치:
npm install
  1. 서버를 빌드하세요:
npm run build

MCP 구성

Cline MCP 설정에 다음 구성을 추가하세요.

"browser-use": { "command": "node", "args": [ "/home/YOUR_HOME/Documents/Cline/MCP/browser-use-server/build/index.js" ], "env": { // Required: Set at least one API key "GLHF_API_KEY": "your_api_key", "GROQ_API_KEY": "your_api_key", "OPENAI_API_KEY": "your_api_key", "OPENROUTER_API_KEY": "your_api_key", "GITHUB_API_KEY": "your_api_key", "DEEPSEEK_API_KEY": "your_api_key", "GEMINI_API_KEY": "your_api_key", "OLLAMA_API_KEY": "your_api_key", // Optional: Configuration overrides "MODEL": "your_preferred_model", "BASE_URL": "your_custom_url", "USE_VISION": "false" }, "disabled": false, "autoApprove": [] }

바꾸다:

  • YOUR_HOME 실제 홈 디렉토리 이름으로 변경
  • 실제 API 키와 your_api_key 함께 사용하세요

용법

서버를 실행합니다:

node build/index.js

서버는 stdio에서 사용할 수 있으며 다음 작업을 지원합니다.

스크린샷

매개변수:

  • url: 웹페이지 URL(필수)
  • full_page: 전체 페이지를 캡처할지 아니면 뷰포트만 캡처할지 여부(선택 사항, 기본값: false)
  • steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)

HTML 가져오기

매개변수:

  • url: 웹페이지 URL(필수)
  • steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)

JavaScript 실행

매개변수:

  • url: 웹페이지 URL(필수)
  • 스크립트: 실행할 JavaScript 코드(필수)
  • steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)

콘솔 로그 가져오기

매개변수:

  • url: 웹페이지 URL(필수)
  • steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)

클라인 사용 예시

다음은 Cline과 함께 브라우저 사용 서버를 사용하여 수행할 수 있는 몇 가지 작업의 예입니다.

개발 중 웹 페이지 요소 수정

인증이 필요한 페이지에서 제목의 색상을 변경하려면:

Change the colour of the headline with the text "Alle Foren im Überblick." to deep blue on https://localhost:3000/foren/ page To check/see the page, use browser-use MCP server to: Open https://localhost:3000/auth, Login with ztobs:Password123, Navigate to https://localhost:3000/foren/, Accept cookies if required hint: execute all browser actions in one command with multiple comma-separated steps

이 작업에서는 다음 사항을 보여줍니다.

  • 쉼표로 구분된 단계를 사용한 다단계 브라우저 자동화
  • 인증 처리
  • 쿠키 수락
  • DOM 조작
  • CSS 스타일 변경

서버는 이러한 단계를 순차적으로 실행하면서 그 과정에서 필요한 상호작용을 처리합니다.

구성

LLM 구성

서버는 기본 구성을 사용하여 여러 LLM 공급자를 지원합니다.

  • GLHF: deepseek-ai/DeepSeek-V3 모델을 사용합니다.
  • Ollama: 32k 컨텍스트 창을 사용하는 qwen2.5:32b-instruct-q4_K_M 모델을 사용합니다.
  • Groq: deepseek-r1-distill-llama-70b 모델을 사용합니다.
  • OpenAI: gpt-4o-mini 모델을 사용합니다.
  • Openrouter: deepseek/deepseek-chat 모델을 사용합니다.
  • Github: gpt-4o-mini 모델 사용
  • DeepSeek: deepseek-chat 모델을 사용합니다
  • Gemini: gemini-2.0-flash-exp 모델을 사용합니다.

환경 변수를 사용하여 이러한 기본값을 재정의할 수 있습니다.

  • MODEL : 모든 공급자에 대한 사용자 정의 모델 이름 설정
  • BASE_URL : 사용자 정의 API 엔드포인트 URL을 설정합니다(공급자가 지원하는 경우)

비전 지원

서버는 USE_VISION 환경 변수를 통해 비전 기능을 지원합니다.

  • 브라우저 작업에 대한 비전 기능을 활성화하려면 USE_VISION=true를 설정합니다.
  • 비전이 필요하지 않을 때 성능을 최적화하기 위해 기본값은 false입니다.
  • 웹 페이지 콘텐츠의 시각적 이해가 필요한 작업에 유용합니다.

Xvfb 지원

서버는 Xvfb가 설치되어 있는지 자동으로 감지합니다.

  • 사용 가능한 경우 xvfb-run을 사용하여 봇 감지 없이 더 나은 브라우저 자동화를 활성화합니다.
  • Xvfb가 설치되지 않은 경우 직접 실행으로 돌아갑니다.
  • RUNNING_UNDER_XVFB 환경 변수를 적절히 설정합니다.

타임아웃

기본 제한 시간은 5분(300000ms)입니다. build/index.js 파일의 TIMEOUT 상수를 수정하여 이 값을 변경하세요.

오류 처리

서버는 다음에 대한 자세한 오류 메시지를 제공합니다.

  • Python 스크립트 실행 실패
  • 브라우저 작업 시간 초과
  • 잘못된 매개변수

디버깅

디버깅을 위해 MCP Inspector를 사용하세요.

npm run inspector

소환

@software{browser_use2024, author = {Müller, Magnus and Žunič, Gregor}, title = {Browser Use: Enable AI to control your browser}, year = {2024}, publisher = {GitHub}, url = {https://github.com/browser-use/browser-use} }

특허

MIT

You must be authenticated.

A
security – no known vulnerabilities
F
license - not found
A
quality - confirmed to work

Python 스크립트를 사용하여 브라우저 자동화를 활성화하고, 웹페이지 스크린샷 찍기, HTML 콘텐츠 검색, JavaScript 실행과 같은 작업을 제공합니다.

  1. Features
    1. Browser Operations
  2. Prerequisites
    1. Installation
      1. Installing via Smithery
    2. MCP Configuration
      1. Usage
        1. Screenshot
        2. Get HTML
        3. Execute JavaScript
        4. Get Console Logs
      2. Example Cline Usage
        1. Modifying Web Page Elements during Development
      3. Configuration
        1. LLM Configuration
        2. Vision Support
        3. Xvfb Support
        4. Timeout
      4. Error Handling
        1. Debugging
          1. Citation
            1. License
              ID: 0aqrsbhx3z