옴니파서-오토GUI-MCP
( 일본어版はちな)
OmniParser를 통해 화면을 분석하고 GUI를 자동으로 구동하는 MCP 서버 입니다.
Windows에서는 확인되었습니다.
라이센스 참고 사항
이는 MIT 라이센스이지만 하위 모듈과 하위 패키지는 제외됩니다.
OmniParser의 저장소는 CC-BY-4.0입니다.
각 OmniParser 모델에는 다른 라이선스가 있습니다( 참조 ).
Related MCP server: Google Toolbox
설치
다음을 수행하세요.
지엑스피1
(Windows가 아닌 경우 set 대신 export 사용하세요.)
( langchain_example.py 작동시키려면 대신 uv sync --extra langchain 사용하세요.)
claude_desktop_config.json에 다음을 추가하세요:
( D:\\CLONED_PATH\\omniparser-autogui-mcp 복제한 디렉토리로 바꾸세요.)
env 다음과 같은 추가 구성을 허용합니다.
OMNI_PARSER_BACKEND_LOAD
다른 클라이언트(예: LibreChat )에서 작동하지 않는 경우1지정하세요.TARGET_WINDOW_NAME
동작할 창을 지정하고 싶으시면 창 이름을 지정해 주세요.
지정하지 않으면 전체 화면에서 작동합니다.OMNI_PARSER_SERVER
OmniParser 처리를 다른 장치에서 수행하려면127.0.0.1:8000과 같이 서버의 주소와 포트를 지정합니다.
서버는uv run omniparserserver로 시작할 수 있습니다.SSE_HOST,SSE_PORT
지정된 경우, 통신은 stdio 대신 SSE를 통해 이루어집니다.SOM_MODEL_PATH,CAPTION_MODEL_NAME,CAPTION_MODEL_PATH,OMNI_PARSER_DEVICE,BOX_TRESHOLD
이는 OmniParser 구성을 위한 것입니다.
일반적으로 필요하지 않습니다.
사용 예
화면 브라우저에서 "MCP 서버"를 검색하세요.
등.