A
securityF
licenseA
qualityEnables browser automation for LLMs on Linux display servers, supporting web interaction, screenshots, and JavaScript execution in a real browser.
Last updated -
7
5
4
JavaScript
( 일본어版はちな)
OmniParser를 통해 화면을 분석하고 GUI를 자동으로 구동하는 MCP 서버 입니다.
Windows에서는 확인되었습니다.
이는 MIT 라이센스이지만 하위 모듈과 하위 패키지는 제외됩니다.
OmniParser의 저장소는 CC-BY-4.0입니다.
각 OmniParser 모델에는 다른 라이선스가 있습니다( 참조 ).
지엑스피1
(Windows가 아닌 경우 set
대신 export
사용하세요.)
( langchain_example.py
작동시키려면 대신 uv sync --extra langchain
사용하세요.)
claude_desktop_config.json
에 다음을 추가하세요:( D:\\CLONED_PATH\\omniparser-autogui-mcp
복제한 디렉토리로 바꾸세요.)
env
다음과 같은 추가 구성을 허용합니다.
OMNI_PARSER_BACKEND_LOAD
1
지정하세요.TARGET_WINDOW_NAME
OMNI_PARSER_SERVER
127.0.0.1:8000
과 같이 서버의 주소와 포트를 지정합니다.uv run omniparserserver
로 시작할 수 있습니다.SSE_HOST
, SSE_PORT
SOM_MODEL_PATH
, CAPTION_MODEL_NAME
, CAPTION_MODEL_PATH
, OMNI_PARSER_DEVICE
, BOX_TRESHOLD
등.
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
화면 GUI의 자동 작동.
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/NON906/omniparser-autogui-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server