MCP Windows 데스크톱 자동화
AutoIt을 사용한 Windows 데스크톱 자동화를 위한 MCP(Model Context Protocol) 서버입니다.
개요
이 프로젝트는 node-autoit-koffi 패키지를 래핑하는 TypeScript MCP 서버를 제공하여 LLM 애플리케이션이 MCP 프로토콜을 통해 Windows 데스크톱 작업을 자동화할 수 있도록 합니다.
서버는 다음을 노출합니다.
- 도구 : 모든 AutoIt 기능은 MCP 도구로 작동합니다.
- 리소스 : 파일 접근 및 스크린샷 기능
- 프롬프트 : 일반적인 자동화 작업을 위한 템플릿
특징
- 모든 AutoIt 기능을 MCP 도구로 완벽하게 래핑
- stdio 및 WebSocket 전송 모두 지원
- 파일 및 디렉토리 읽기를 위한 파일 액세스 리소스
- 화면이나 특정 창을 캡처하기 위한 스크린샷 리소스
- 일반적인 자동화 작업을 위한 프롬프트 템플릿
- 전반적으로 엄격한 TypeScript 타이핑
설치
지엑스피1
용법
서버 시작
# Start with stdio transport (default)
npm start
# Start with WebSocket transport
npm start -- --transport=websocket --port=3000
# Enable verbose logging
npm start -- --verbose
명령줄 옵션
--transport=stdio|websocket
: 전송 프로토콜을 지정합니다(기본값: stdio)--port=<number>
: WebSocket 전송을 위한 포트를 지정합니다(기본값: 3000)--verbose
: 자세한 로깅을 활성화합니다.
도구
서버는 다음을 위한 도구를 제공합니다.
- 마우스 조작 : 이동, 클릭, 드래그 등
- 키보드 작업 : 키 입력, 클립보드 작업 등을 전송합니다.
- 창 관리 : 창 찾기, 활성화, 닫기, 크기 조절 등
- 컨트롤 조작 : UI 컨트롤, 버튼, 텍스트 필드 등과 상호작용합니다.
- 프로세스 관리 : 프로세스 시작, 중지 및 모니터링
- 시스템 작업 : 종료, 절전 등
자원
서버는 다음에 대한 리소스를 제공합니다.
- 파일 접근 : 파일 읽기 및 디렉토리 나열
- 스크린샷 : 화면이나 특정 창을 캡처합니다.
프롬프트
서버는 다음에 대한 프롬프트 템플릿을 제공합니다.
- 창 상호 작용 : 창 찾기 및 상호 작용
- 양식 작성 : 양식 작성 작업 자동화
- 자동화 작업 : 반복적인 작업을 위한 스크립트 생성
- 모니터링 : 특정 조건을 기다립니다
개발
# Run in development mode
npm run dev
# Lint the code
npm run lint
# Run tests
npm run test
특허
MIT