A
securityF
licenseA
qualityEnables browser automation for LLMs on Linux display servers, supporting web interaction, screenshots, and JavaScript execution in a real browser.
Last updated -
7
5
4
JavaScript
(日本語版はこちら)
OmniParserで画面を解析し、GUIを自動操作するMCPサーバーです。
Windowsで確認済み。
これは MIT ライセンスですが、サブモジュールとサブパッケージは除きます。
OmniParser のリポジトリは CC-BY-4.0 です。
各 OmniParser モデルには異なるライセンスがあります (参照)。
(Windows 以外の場合は、 set
の代わりにexport
を使用します。)
( langchain_example.py
を動作させたい場合は、代わりにuv sync --extra langchain
実行してください。)
claude_desktop_config.json
に追加します:( D:\\CLONED_PATH\\omniparser-autogui-mcp
をクローンしたディレクトリに置き換えます。)
env
次の追加構成が可能です。
OMNI_PARSER_BACKEND_LOAD
1
指定します。TARGET_WINDOW_NAME
OMNI_PARSER_SERVER
127.0.0.1:8000
などのサーバーのアドレスとポートを指定します。uv run omniparserserver
で起動できます。SSE_HOST
、 SSE_PORT
SOM_MODEL_PATH
、 CAPTION_MODEL_NAME
、 CAPTION_MODEL_PATH
、 OMNI_PARSER_DEVICE
、 BOX_TRESHOLD
等
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
オンスクリーンGUIの自動操作。
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/NON906/omniparser-autogui-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server