Skip to main content
Glama

omniparser-autogui-mcp

omniparser-autogui-mcp

(日本語版はこちら)

Este es un servidor MCP que analiza la pantalla con OmniParser y opera automáticamente la GUI.
Confirmado en Windows.

Notas de licencia

Esta es una licencia MIT, pero excluye submódulos y subpaquetes.
El repositorio de OmniParser es CC-BY-4.0.
Cada modelo de OmniParser tiene una licencia diferente ( referencia ).

Instalación

  1. Por favor haga lo siguiente:
git clone --recursive https://github.com/NON906/omniparser-autogui-mcp.git cd omniparser-autogui-mcp uv sync set OCR_LANG=en uv run download_models.py

(Además de Windows, utilice export en lugar de set ).
(Si desea que langchain_example.py funcione, uv sync --extra langchain en su lugar).

  1. Agregue esto a su claude_desktop_config.json :
{ "mcpServers": { "omniparser_autogui_mcp": { "command": "uv", "args": [ "--directory", "D:\\CLONED_PATH\\omniparser-autogui-mcp", "run", "omniparser-autogui-mcp" ], "env": { "PYTHONIOENCODING": "utf-8", "OCR_LANG": "en" } } } }

(Reemplace D:\\CLONED_PATH\\omniparser-autogui-mcp con el directorio que clonó).

env permite las siguientes configuraciones adicionales:

  • OMNI_PARSER_BACKEND_LOAD
    Si no funciona con otros clientes (como LibreChat ), especifique 1 .
  • TARGET_WINDOW_NAME
    Si desea especificar la ventana a operar, especifique el nombre de la ventana.
    Si no se especifica, opera en toda la pantalla.
  • OMNI_PARSER_SERVER
    Si desea que el procesamiento de OmniParser se realice en otro dispositivo, especifique la dirección y el puerto del servidor, como 127.0.0.1:8000 .
    El servidor se puede iniciar con uv run omniparserserver .
  • SSE_HOST , SSE_PORT
    Si se especifica, la comunicación se realizará a través de SSE en lugar de stdio.
  • SOM_MODEL_PATH , CAPTION_MODEL_NAME , CAPTION_MODEL_PATH , OMNI_PARSER_DEVICE , BOX_TRESHOLD
    Estos son para la configuración de OmniParser.
    Por lo general no son necesarios.

Ejemplos de uso

  • Busque "servidor MCP" en el navegador en pantalla.

etc.

-
security - not tested
A
license - permissive license
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Funcionamiento automático de la GUI en pantalla.

  1. Notas de licencia
    1. Instalación
      1. Ejemplos de uso

        Related MCP Servers

        • A
          security
          F
          license
          A
          quality
          Enables browser automation for LLMs on Linux display servers, supporting web interaction, screenshots, and JavaScript execution in a real browser.
          Last updated -
          7
          5
          4
          JavaScript
          • Linux
        • A
          security
          F
          license
          A
          quality
          Enables browser automation using Python scripts, offering operations like taking webpage screenshots, retrieving HTML content, and executing JavaScript.
          Last updated -
          4
          18
          Python
          • Linux
        • -
          security
          A
          license
          -
          quality
          Automates interactions with SAP GUI using the Model Context Protocol, allowing precise control of SAP transactions through tools like clicking, typing, scrolling, and transaction management.
          Last updated -
          9
          Python
          MIT License
        • -
          security
          F
          license
          -
          quality
          A companion desktop app enabling bi-directional interaction between Claude Desktop and visual UI elements, allowing Claude to display, read from, and write to interactive interfaces while processing user events and feedback.
          Last updated -
          5
          1
          TypeScript
          • Apple

        View all related MCP servers

        MCP directory API

        We provide all the information about MCP servers via our MCP API.

        curl -X GET 'https://glama.ai/api/mcp/v1/servers/NON906/omniparser-autogui-mcp'

        If you have feedback or need assistance with the MCP directory API, please join our Discord server