MCP 데스크톱 자동화
RobotJS와 스크린샷 기능을 사용하여 데스크톱 자동화 기능을 제공하는 모델 컨텍스트 프로토콜 서버입니다. 이 서버를 통해 LLM은 마우스 움직임, 키보드 입력을 제어하고 데스크톱 환경의 스크린샷을 캡처할 수 있습니다.
Desktop Automation Server를 사용하기 위한 구성
MCP Desktop Automation 서버를 사용하도록 Claude Desktop을 구성하는 방법은 다음과 같습니다.
엔피엑스
지엑스피1
권한
이 서버에는 다음 작업을 위해 시스템 수준 권한이 필요합니다.
화면의 스크린샷을 캡처하세요
마우스 움직임과 클릭을 제어합니다
키보드 입력 시뮬레이션
이 서버에서 처음으로 Claude Desktop을 실행할 때 운영 체제의 보안 설정에서 이러한 권한을 부여해야 할 수도 있습니다.
Related MCP server: AI Vision Debug MCP Server
제한 사항
이 서버는 다양한 MCP 클라이언트와 호환되지만 주로 Claude Desktop으로 테스트되었습니다.
중요 : 현재 구현에서는 응답 크기가 1MB로 제한됩니다. 화면 캡처의 경우, 이는 다음을 의미합니다.
고해상도 스크린샷은 이 제한을 초과하여 실패할 수 있습니다.
테스트 결과 800x600 해상도가 안정적으로 작동하는 것으로 나타났습니다.
문제가 발생하면 화면 해상도를 낮추거나 특정 화면 영역을 캡처하는 것을 고려하세요.
요구 사항
노드.js (>=14.x)
구성 요소
도구
화면 크기를 가져오세요
화면 크기를 가져옵니다
입력 매개변수가 필요하지 않습니다
화면 캡처
현재 화면 내용을 캡처합니다
입력 매개변수가 필요하지 않습니다
키보드 누르기
키보드 키 또는 키 조합을 누릅니다.
입력:
key(문자열, 필수): 누를 키(예: 'enter', 'a', 'control')modifiers(문자열 배열, 선택 사항): 키를 누르는 동안 누르고 있을 수정 키입니다. 가능한 값: "control", "shift", "alt", "command"
키보드_유형
현재 커서 위치에 텍스트를 입력합니다.
입력:
text(문자열, 필수): 입력할 텍스트
마우스 클릭
마우스 클릭을 수행합니다
입력:
button(문자열, 선택 사항, 기본값: "left"): 클릭할 마우스 버튼입니다. 가능한 값: "left", "right", "middle"double(부울, 선택 사항, 기본값: false): 더블 클릭을 수행할지 여부
마우스 이동
마우스를 지정된 좌표로 이동합니다.
입력:
x(숫자, 필수): X 좌표y(숫자, 필수): Y 좌표
자원
이 서버는 스크린샷에 대한 액세스를 제공합니다.
스크린샷 목록 (
screenshot://list)사용 가능한 모든 스크린샷을 이름으로 나열합니다.
스크린샷 내용 (
screenshot://{id})캡처된 스크린샷의 PNG 이미지
스크린샷 ID(타임스탬프 기반 명명)를 통해 접근 가능
주요 특징
데스크톱 마우스 제어
키보드 입력 시뮬레이션
화면 크기 감지
스크린샷 기능
간단한 JSON 응답 형식
특허
이 MCP 서버는 MIT 라이선스에 따라 라이선스가 부여됩니다. 즉, MIT 라이선스의 약관에 따라 소프트웨어를 자유롭게 사용, 수정 및 배포할 수 있습니다. 자세한 내용은 프로젝트 저장소의 LICENSE 파일을 참조하세요.