local-only server
The server can only run on the client’s local machine because it depends on local resources.
Integrations
Enables search and browsing of products on Amazon through browser automation, with an example project named 'amazon-shopping' for searching items like dinner plates.
Integrates with OpenAI's Computer Use API to interpret and execute natural language instructions for browser automation, supporting a wide range of actions like clicking, typing, and scrolling.
MCP 브라우저 운영자
LLM이 표준화된 JSON-RPC 인터페이스를 통해 웹 브라우저를 제어하고, 웹 페이지와 상호 작용하고, 웹 콘텐츠를 분석할 수 있도록 하는 브라우저 자동화를 위한 MCP(모델 제어 프로토콜) 서버입니다.
특징
- 브라우저 관리 : 브라우저 인스턴스 생성, 탐색, 작동 및 닫기
- 작업 관리 : 작업 ID를 사용하여 브라우저 작업 상태 추적
- 웹 상호작용 : OpenAI의 컴퓨터 사용 API를 사용하여 자연어 명령 실행
- 브라우저 도구 : 콘솔 로그, 네트워크 활동, 스크린샷 등에 액세스합니다.
- 감사 : 접근성, 성능, SEO 및 기타 웹 페이지 감사 실행
요구 사항
- 파이썬 3.11+
- 극작가
- OpenAI API 키(컴퓨터 사용 API용)
설치
- 이 저장소를 복제하세요:지엑스피1
- 종속성 설치:Copy
- Playwright 브라우저 설치:Copy
- OpenAI API 키를 설정하세요:Copy
용법
MCP 서버를 시작합니다.
서버는 MCP 프로토콜에 따라 stdin에서 JSON-RPC 요청을 수신하고 stdout에서 응답합니다.
실행 가능한 스크립트
run-server
- MCP 서버(주요 진입점)를 실행합니다.Copyrun-tests
- 모든 테스트를 실행합니다(단위 또는 통합에 대한 옵션만 있음)Copyrun-test-harness
- 대화형 테스트를 위해 MCP Inspector로 서버를 실행합니다.Copy
핵심 방법
브라우저 관리
- 브라우저 생성 : 새 브라우저 인스턴스를 초기화합니다.Copy
- 브라우저 탐색 : 브라우저를 지정된 URL로 이동합니다.Copy
- 브라우저 작동 : 브라우저 상호 작용을 위한 자연어 명령 실행Copy
- 브라우저 닫기 : 브라우저 인스턴스 종료Copy
작업 관리
- 작업 상태 가져오기 : 작업 ID로 작업의 상태 및 결과를 검색합니다.Copy
- 작업 목록 : 최근 브라우저 작업 보기Copy
사용자 참고 사항
- 메모 추가 : 브라우저 작업과 관련된 메모를 생성하고 저장합니다.Copy
추가 방법
브라우저 디버깅 도구
- 콘솔 로그 가져오기 :
mcp__browser-tools__getConsoleLogs
- 콘솔 오류 가져오기 :
mcp__browser-tools__getConsoleErrors
- 네트워크 로그 가져오기 :
mcp__browser-tools__getNetworkLogs
- 네트워크 오류 가져오기 :
mcp__browser-tools__getNetworkErrors
- 스크린샷 찍기 :
mcp__browser-tools__takeScreenshot
- 선택한 요소 가져오기 :
mcp__browser-tools__getSelectedElement
- 로그 삭제 :
mcp__browser-tools__wipeLogs
감사 도구
- 접근성 감사 실행 :
mcp__browser-tools__runAccessibilityAudit
- 성능 감사 실행 :
mcp__browser-tools__runPerformanceAudit
- SEO 감사 실행 :
mcp__browser-tools__runSEOAudit
- NextJS 감사 실행 :
mcp__browser-tools__runNextJSAudit
- 모범 사례 감사 실행 :
mcp__browser-tools__runBestPracticesAudit
- 디버거 모드 실행 :
mcp__browser-tools__runDebuggerMode
- 감사 모드 실행 :
mcp__browser-tools__runAuditMode
비동기 워크플로 패턴
브라우저 작업은 비동기적이며 작업 기반 접근 방식을 사용합니다.
- 작업 시작 : job_id를 반환하는 브라우저 메서드를 호출합니다.
- 완료를 위한 투표 : 작업이 완료될 때까지 get-job-status를 사용하세요.
- 프로세스 결과 : 작업이 완료되면 작업 상태에서 결과에 액세스합니다.
이 접근 방식은 복잡한 브라우저 작업을 완료하는 동시에 클라이언트 시간 초과를 방지합니다.
지속적인 브라우저 상태
MCP 운영자는 프로젝트 이름으로 브라우저가 생성될 때 영구 상태를 유지합니다.
- 브라우저 상태(쿠키, 로컬 스토리지, 세션 스토리지)는 세션 간에 보존됩니다.
- 여러 프로젝트가 독립적인 브라우저 상태를 유지할 수 있습니다.
- 로그인 세션, 쇼핑 카트 또는 기타 개인화된 상태를 유지하는 데 유용합니다.
프로젝트 구조
src/mcp_operator/
: 메인 패키지__init__.py
: 패키지 초기화__main__.py
: 패키지의 진입점server.py
: MCP 서버 구현browser.py
: 브라우저 연산자 구현cua/
: 컴퓨터 사용 API 구성 요소agent.py
: 에이전트 구현computer.py
: 컴퓨터 인터페이스utils.py
: 유틸리티 함수
run-server
: MCP 서버를 실행하는 스크립트run-tests
: 단위 및 통합 테스트를 실행하는 스크립트run-test-harness
: MCP Inspector로 실행할 스크립트
개발
MCP Inspector 사용
디버깅을 위해 MCP Inspector를 사용하세요.
이는 MCP 서버를 테스트하기 위한 웹 인터페이스를 제공합니다.
보안
- 잠재적으로 유해한 사이트에 대한 도메인 차단
- 탐색 전 URL 검증
- 다양한 브라우저 인스턴스 간 세션 격리
- 파일 기반 로깅(MCP 프로토콜을 보존하기 위한 stdout 없음)
This server cannot be installed
AI 어시스턴트가 지속적인 상태 관리를 통해 Chrome을 제어하고, 비동기 브라우저 작업을 통해 복잡한 브라우징 작업을 수행할 수 있는 웹 브라우저 자동화 서버입니다.