Integrations
Serves as the runtime environment for the MCP server, with Node.js version 14.x or higher required for operation.
MCP 데스크톱 자동화
RobotJS와 스크린샷 기능을 사용하여 데스크톱 자동화 기능을 제공하는 모델 컨텍스트 프로토콜 서버입니다. 이 서버를 통해 LLM은 마우스 움직임, 키보드 입력을 제어하고 데스크톱 환경의 스크린샷을 캡처할 수 있습니다.
Desktop Automation Server를 사용하기 위한 구성
MCP Desktop Automation 서버를 사용하도록 Claude Desktop을 구성하는 방법은 다음과 같습니다.
엔피엑스
지엑스피1
권한
이 서버에는 다음 작업을 위해 시스템 수준 권한이 필요합니다.
- 화면의 스크린샷을 캡처하세요
- 마우스 움직임과 클릭을 제어합니다
- 키보드 입력 시뮬레이션
이 서버에서 처음으로 Claude Desktop을 실행할 때 운영 체제의 보안 설정에서 이러한 권한을 부여해야 할 수도 있습니다.
제한 사항
이 서버는 다양한 MCP 클라이언트와 호환되지만 주로 Claude Desktop으로 테스트되었습니다.
중요 : 현재 구현에서는 응답 크기가 1MB로 제한됩니다. 화면 캡처의 경우, 이는 다음을 의미합니다.
- 고해상도 스크린샷은 이 제한을 초과하여 실패할 수 있습니다.
- 테스트 결과 800x600 해상도가 안정적으로 작동하는 것으로 나타났습니다.
- 문제가 발생하면 화면 해상도를 낮추거나 특정 화면 영역을 캡처하는 것을 고려하세요.
요구 사항
- 노드.js (>=14.x)
구성 요소
도구
- 화면 크기를 가져오세요
- 화면 크기를 가져옵니다
- 입력 매개변수가 필요하지 않습니다
- 화면 캡처
- 현재 화면 내용을 캡처합니다
- 입력 매개변수가 필요하지 않습니다
- 키보드 누르기
- 키보드 키 또는 키 조합을 누릅니다.
- 입력:
key
(문자열, 필수): 누를 키(예: 'enter', 'a', 'control')modifiers
(문자열 배열, 선택 사항): 키를 누르는 동안 누르고 있을 수정 키입니다. 가능한 값: "control", "shift", "alt", "command"
- 키보드_유형
- 현재 커서 위치에 텍스트를 입력합니다.
- 입력:
text
(문자열, 필수): 입력할 텍스트
- 마우스 클릭
- 마우스 클릭을 수행합니다
- 입력:
button
(문자열, 선택 사항, 기본값: "left"): 클릭할 마우스 버튼입니다. 가능한 값: "left", "right", "middle"double
(부울, 선택 사항, 기본값: false): 더블 클릭을 수행할지 여부
- 마우스 이동
- 마우스를 지정된 좌표로 이동합니다.
- 입력:
x
(숫자, 필수): X 좌표y
(숫자, 필수): Y 좌표
자원
이 서버는 스크린샷에 대한 액세스를 제공합니다.
- 스크린샷 목록 (
screenshot://list
)- 사용 가능한 모든 스크린샷을 이름으로 나열합니다.
- 스크린샷 내용 (
screenshot://{id}
)- 캡처된 스크린샷의 PNG 이미지
- 스크린샷 ID(타임스탬프 기반 명명)를 통해 접근 가능
주요 특징
- 데스크톱 마우스 제어
- 키보드 입력 시뮬레이션
- 화면 크기 감지
- 스크린샷 기능
- 간단한 JSON 응답 형식
특허
이 MCP 서버는 MIT 라이선스에 따라 라이선스가 부여됩니다. 즉, MIT 라이선스의 약관에 따라 소프트웨어를 자유롭게 사용, 수정 및 배포할 수 있습니다. 자세한 내용은 프로젝트 저장소의 LICENSE 파일을 참조하세요.
This server cannot be installed
RobotJS와 스크린샷 기능을 사용하여 데스크톱 자동화 기능을 제공하는 모델 컨텍스트 프로토콜 서버로, LLM이 마우스 움직임과 키보드 입력을 제어하고 데스크톱 환경의 스크린샷을 캡처할 수 있도록 합니다.
Appeared in Searches
- Creating a Due Diligence Report for Rizhao Urban Investment Using Audit Reports, Annual Reports, and Rating Reports
- A Windows COM server for automating Windows tasks
- Using Claude Desktop to Create a Document in Pages on Mac
- A server for connecting an agent to operate on an open-world basis for functionality like Siri or Alexa
- Understanding and Using the Browser Console