브라우저 사용 서버
Python 스크립트를 사용한 브라우저 자동화를 위한 모델 컨텍스트 프로토콜 서버입니다. Cline과 함께 사용 가능
특징
브라우저 작업
screenshot
: 웹페이지(전체 페이지 또는 뷰포트)의 스크린샷을 캡처합니다.get_html
: 웹페이지의 HTML 콘텐츠를 검색합니다.execute_js
: 웹페이지에서 JavaScript 실행get_console_logs
: 웹페이지에서 콘솔 로그를 가져옵니다.
모든 작업은 페이지 로드 후 사용자 지정 상호작용 단계(예: 요소 클릭, 스크롤)를 지원합니다.
필수 조건
- (선택 사항이지만 권장됨) 헤드리스 브라우저 자동화를 위해 Xvfb를 설치하세요.
지엑스피1
Xvfb(X Virtual Frame Buffer)는 가상 디스플레이를 생성하여 봇으로 감지되지 않고 브라우저 자동화를 가능하게 합니다. Xvfb에 대한 자세한 내용은 여기를 참조하세요.
- Miniconda 또는 Anaconda 설치
- Conda 환경을 만듭니다.
- LLM 구성 설정:
이 서버는 여러 LLM 공급자를 지원합니다. 다음 API 키를 사용할 수 있습니다.
서버는 자동으로 찾은 첫 번째 사용 가능한 API 키를 사용합니다. 환경 변수를 사용하여 모든 공급자의 모델과 기본 URL을 사용자 지정할 수 있습니다.
설치
Smithery를 통해 설치
Smithery를 통해 Claude Desktop용 Browser Use Server를 자동으로 설치하려면:
- 이 저장소를
/home/YOUR_HOME/Documents/Cline/
디렉토리로 복제합니다. - 종속성 설치:
- 서버를 빌드하세요:
MCP 구성
Cline MCP 설정에 다음 구성을 추가하세요.
바꾸다:
YOUR_HOME
실제 홈 디렉토리 이름으로 변경- 실제 API 키와
your_api_key
함께 사용하세요
용법
서버를 실행합니다:
서버는 stdio에서 사용할 수 있으며 다음 작업을 지원합니다.
스크린샷
매개변수:
- url: 웹페이지 URL(필수)
- full_page: 전체 페이지를 캡처할지 아니면 뷰포트만 캡처할지(선택 사항, 기본값: false)
- steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)
HTML 가져오기
매개변수:
- url: 웹페이지 URL(필수)
- steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)
JavaScript 실행
매개변수:
- url: 웹페이지 URL(필수)
- 스크립트: 실행할 JavaScript 코드(필수)
- steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)
콘솔 로그 가져오기
매개변수:
- url: 웹페이지 URL(필수)
- steps: 페이지 로드 후 수행해야 할 단계를 설명하는 쉼표로 구분된 작업 또는 문장(선택 사항)
클라인 사용 예시
다음은 Cline과 함께 브라우저 사용 서버를 사용하여 수행할 수 있는 몇 가지 작업의 예입니다.
개발 중 웹 페이지 요소 수정
인증이 필요한 페이지에서 제목의 색상을 변경하려면:
이 작업에서는 다음 사항을 보여줍니다.
- 쉼표로 구분된 단계를 사용한 다단계 브라우저 자동화
- 인증 처리
- 쿠키 수락
- DOM 조작
- CSS 스타일 변경
서버는 이러한 단계를 순차적으로 실행하면서 그 과정에서 필요한 상호작용을 처리합니다.
구성
LLM 구성
서버는 기본 구성을 사용하여 여러 LLM 공급자를 지원합니다.
- GLHF: deepseek-ai/DeepSeek-V3 모델을 사용합니다.
- Ollama: 32k 컨텍스트 창을 사용하는 qwen2.5:32b-instruct-q4_K_M 모델을 사용합니다.
- Groq: deepseek-r1-distill-llama-70b 모델을 사용합니다.
- OpenAI: gpt-4o-mini 모델을 사용합니다.
- Openrouter: deepseek/deepseek-chat 모델을 사용합니다.
- Github: gpt-4o-mini 모델 사용
- DeepSeek: deepseek-chat 모델을 사용합니다
- Gemini: gemini-2.0-flash-exp 모델을 사용합니다.
환경 변수를 사용하여 이러한 기본값을 재정의할 수 있습니다.
MODEL
: 모든 공급자에 대한 사용자 정의 모델 이름 설정BASE_URL
: 사용자 정의 API 엔드포인트 URL을 설정합니다(공급자가 지원하는 경우)
비전 지원
서버는 USE_VISION 환경 변수를 통해 비전 기능을 지원합니다.
- 브라우저 작업에 대한 비전 기능을 활성화하려면 USE_VISION=true를 설정합니다.
- 비전이 필요하지 않을 때 성능을 최적화하기 위해 기본값은 false입니다.
- 웹 페이지 콘텐츠의 시각적 이해가 필요한 작업에 유용합니다.
Xvfb 지원
서버는 Xvfb가 설치되어 있는지 자동으로 감지합니다.
- 사용 가능한 경우 xvfb-run을 사용하여 봇 감지 없이 더 나은 브라우저 자동화를 활성화합니다.
- Xvfb가 설치되지 않은 경우 직접 실행으로 돌아갑니다.
- RUNNING_UNDER_XVFB 환경 변수를 적절히 설정합니다.
타임아웃
기본 제한 시간은 5분(300000ms)입니다. build/index.js
파일의 TIMEOUT 상수를 수정하여 이 값을 변경하세요.
오류 처리
서버는 다음에 대한 자세한 오류 메시지를 제공합니다.
- Python 스크립트 실행 실패
- 브라우저 작업 시간 초과
- 잘못된 매개변수
디버깅
디버깅을 위해 MCP Inspector를 사용하세요.
용도
특허
MIT
Related MCP Servers
- AsecurityAlicenseAqualityFacilitates browser automation with custom capabilities and agent-based interactions, integrated through the browser-use library.Last updated -1541PythonMIT License
- AsecurityAlicenseAqualityEnables browser automation with Puppeteer, supporting navigation, form interactions, and connection to active Chrome instances for comprehensive web page interaction.Last updated -84708TypeScriptMIT License
- -securityAlicense-qualityEnables browser automation using the Selenium WebDriver through MCP, supporting browser management, element location, and both basic and advanced user interactions.Last updated -17521JavaScriptMIT License
- -securityAlicense-qualityA browser automation agent that enables Claude to interact with web browsers through the Model Context Protocol, allowing for actions like navigating websites, manipulating elements, and managing browser state.Last updated -2PythonMIT License