Skip to main content
Glama

Browser-Use MCP Server

MCP-сервер и CLI для браузера

Примечание к проекту : Эта реализация сервера MCP основана на основе браузера-использования/веб-пользователя . Основная логика автоматизации браузера и шаблоны конфигурации адаптированы из оригинального проекта.

Сервер автоматизации браузера на базе ИИ, реализующий протокол Model Context Protocol (MCP) для управления браузером на естественном языке и веб-исследований. Также предоставляет доступ CLI к своим основным функциям.

Функции

  • 🧠 Интеграция MCP — полная реализация протокола для связи с агентами ИИ.
  • 🌐 Автоматизация браузера — навигация по страницам, заполнение форм, взаимодействие с элементами на естественном языке (инструмент run_browser_agent ).
  • 👁️ Визуальное понимание — дополнительный анализ снимков экрана для обладателей степени магистра права с хорошим зрением.
  • 🔄 Сохранение состояния — возможность управлять сеансом браузера сервера через несколько вызовов MCP или подключаться к браузеру пользователя.
  • 🔌 Поддержка нескольких LLM — интеграция с OpenAI, Anthropic, Azure, DeepSeek, Google, Mistral, Ollama, OpenRouter, Alibaba, Moonshot, Unbound AI.
  • 🔍 Deep Research Tool — специализированный инструмент для многоэтапного веб-исследования и создания отчетов (инструмент run_deep_research ).
  • ⚙️ Конфигурация переменных среды — полностью настраивается с помощью переменных среды с использованием структурированной модели Pydantic.
  • 🔗 Подключение CDP — возможность подключения и управления запущенным пользователем экземпляром Chrome/Chromium через протокол Chrome DevTools.
  • ⌨️ Интерфейс командной строки — доступ к основным функциям агента ( run_browser_agent , run_deep_research ) непосредственно из командной строки для тестирования и создания сценариев.

Быстрый старт

Основы

  1. Установите UV — установщик Python с ракетным двигателем: curl -LsSf https://astral.sh/uv/install.sh | sh
  2. Получите браузеры Playwright (требуются для автоматизации): uvx --from mcp-server-browser-use@latest python -m playwright install

Модели интеграции

Для клиентов MCP, таких как Claude Desktop, добавьте простую конфигурацию сервера:

// Example 1: One-Line Latest Version (Always Fresh) "mcpServers": { "browser-use": { "command": "uvx", "args": ["mcp-server-browser-use@latest"], "env": { "MCP_LLM_GOOGLE_API_KEY": "YOUR_KEY_HERE_IF_USING_GOOGLE", "MCP_LLM_PROVIDER": "google", "MCP_LLM_MODEL_NAME": "gemini-2.5-flash-preview-04-17", "MCP_BROWSER_HEADLESS": "true", } } }
// Example 2: Advanced Configuration with CDP "mcpServers": { "browser-use": { "command": "uvx", "args": ["mcp-server-browser-use@latest"], "env": { "MCP_LLM_OPENROUTER_API_KEY": "YOUR_KEY_HERE_IF_USING_OPENROUTER", "MCP_LLM_PROVIDER": "openrouter", "MCP_LLM_MODEL_NAME": "anthropic/claude-3.5-haiku", "MCP_LLM_TEMPERATURE": "0.4", "MCP_BROWSER_HEADLESS": "false", "MCP_BROWSER_WINDOW_WIDTH": "1440", "MCP_BROWSER_WINDOW_HEIGHT": "1080", "MCP_AGENT_TOOL_USE_VISION": "true", "MCP_RESEARCH_TOOL_SAVE_DIR": "/path/to/your/research", "MCP_RESEARCH_TOOL_MAX_PARALLEL_BROWSERS": "5", "MCP_PATHS_DOWNLOADS": "/path/to/your/downloads", "MCP_BROWSER_USE_OWN_BROWSER": "true", "MCP_BROWSER_CDP_URL": "http://localhost:9222", "MCP_AGENT_TOOL_HISTORY_PATH": "/path/to/your/history", "MCP_SERVER_LOGGING_LEVEL": "DEBUG", "MCP_SERVER_LOG_FILE": "/path/to/your/log/mcp_server_browser_use.log", } } }
// Example 3: Advanced Configuration with User Data and custom chrome path "mcpServers": { "browser-use": { "command": "uvx", "args": ["mcp-server-browser-use@latest"], "env": { "MCP_LLM_OPENAI_API_KEY": "YOUR_KEY_HERE_IF_USING_OPENAI", "MCP_LLM_PROVIDER": "openai", "MCP_LLM_MODEL_NAME": "gpt-4.1-mini", "MCP_LLM_TEMPERATURE": "0.2", "MCP_BROWSER_HEADLESS": "false", "MCP_BROWSER_BINARY_PATH": "/path/to/your/chrome/binary", "MCP_BROWSER_USER_DATA_DIR": "/path/to/your/user/data", "MCP_BROWSER_DISABLE_SECURITY": "true", "MCP_BROWSER_KEEP_OPEN": "true", "MCP_BROWSER_TRACE_PATH": "/path/to/your/trace", "MCP_AGENT_TOOL_HISTORY_PATH": "/path/to/your/history", "MCP_SERVER_LOGGING_LEVEL": "DEBUG", "MCP_SERVER_LOG_FILE": "/path/to/your/log/mcp_server_browser_use.log", } } }
// Example 4: Local Development Flow "mcpServers": { "browser-use": { "command": "uv", "args": [ "--directory", "/your/dev/path", "run", "mcp-server-browser-use" ], "env": { "MCP_LLM_OPENROUTER_API_KEY": "YOUR_KEY_HERE_IF_USING_OPENROUTER", "MCP_LLM_PROVIDER": "openrouter", "MCP_LLM_MODEL_NAME": "openai/gpt-4o-mini", "MCP_BROWSER_HEADLESS": "true", } } }

Ключевая информация: Лучшие конфигурации получаются, если начинать с простого (Пример 1). Файл .env.example содержит все возможные циферблаты.

Инструменты МКП

Этот сервер предоставляет следующие инструменты через протокол контекста модели:

Синхронные инструменты (ожидание завершения)

  1. run_browser_agent
    • Описание: Выполняет задачу автоматизации браузера на основе инструкций естественного языка и ждет ее завершения. Использует настройки из переменных среды MCP_AGENT_TOOL_* , MCP_LLM_* и MCP_BROWSER_* .
    • Аргументы:
      • task (строка, обязательно): Основная задача или цель.
    • Возвращает: (строка) Окончательный результат, извлеченный агентом, или сообщение об ошибке. История агента (JSON, необязательно GIF) сохраняется, если задано MCP_AGENT_TOOL_HISTORY_PATH .
  2. run_deep_research
    • Описание: выполняет углубленное веб-исследование по теме, генерирует отчет и ждет завершения. Использует настройки из переменных среды MCP_RESEARCH_TOOL_* , MCP_LLM_* и MCP_BROWSER_* . Если задан MCP_RESEARCH_TOOL_SAVE_DIR , выходные данные сохраняются в подкаталоге внутри него; в противном случае работает в режиме только памяти.
    • Аргументы:
      • research_task (строка, обязательно): Тема или вопрос исследования.
      • max_parallel_browsers (целое число, необязательное): переопределяет MCP_RESEARCH_TOOL_MAX_PARALLEL_BROWSERS из среды.
    • Возвращает: (строка) Сгенерированный отчет об исследовании в формате Markdown, включая путь к файлу (если сохранен) или сообщение об ошибке.

Использование CLI

Этот пакет также предоставляет интерфейс командной строки mcp-browser-cli для прямого тестирования и написания сценариев.

Глобальные параметры:

  • --env-file PATH, -e PATH : Путь к файлу .env для загрузки конфигураций.
  • --log-level LEVEL, -l LEVEL : Переопределить уровень ведения журнала (например, DEBUG , INFO ).

Команды:

  1. mcp-browser-cli run-browser-agent [OPTIONS] TASK
    • Описание: Запускает задачу агента браузера.
    • Аргументы:
      • TASK (строка, обязательно): Основная задача для агента.
    • Пример:
      mcp-browser-cli run-browser-agent "Go to example.com and find the title." -e .env
  2. mcp-browser-cli run-deep-research [OPTIONS] RESEARCH_TASK
    • Описание: Проводит глубокие веб-исследования.
    • Аргументы:
      • RESEARCH_TASK (строка, обязательно): Тема или вопрос для исследования.
    • Параметры:
      • --max-parallel-browsers INTEGER, -p INTEGER : Переопределить MCP_RESEARCH_TOOL_MAX_PARALLEL_BROWSERS .
    • Пример:
      mcp-browser-cli run-deep-research "What are the latest advancements in AI-driven browser automation?" --max-parallel-browsers 5 -e .env

Все остальные конфигурации (ключи LLM, пути, настройки браузера) берутся из переменных среды (или указанного файла .env ), как подробно описано в разделе «Конфигурация».

Конфигурация (переменные среды)

Настройте сервер и CLI с помощью переменных окружения. Вы можете задать их в своей системе или поместить в файл .env в корне проекта (используйте --env-file для CLI). Переменные структурированы с помощью префиксов.

Группа переменных (префикс)Пример переменнойОписаниеЗначение по умолчанию
Основная степень магистра права (MCP_LLM_)Настройки для основного LLM, используемого агентами.
MCP_LLM_PROVIDERПоставщик LLM. Варианты: openai , azure_openai , anthropic , google , mistral , ollama и т. д.openai
MCP_LLM_MODEL_NAMEКонкретное название модели для поставщика.gpt-4.1
MCP_LLM_TEMPERATUREТемпература LLM (0,0-2,0).0.0
MCP_LLM_BASE_URLНеобязательно: общее переопределение базового URL-адреса поставщика LLM.Специфичный для поставщика
MCP_LLM_API_KEYНеобязательно: универсальный ключ LLM API (имеет приоритет).-
MCP_LLM_OPENAI_API_KEYКлюч API для OpenAI (если поставщик — openai ).-
MCP_LLM_ANTHROPIC_API_KEYAPI-ключ для Anthropic.-
MCP_LLM_GOOGLE_API_KEYAPI-ключ для Google AI (Gemini).-
MCP_LLM_AZURE_OPENAI_API_KEYКлюч API для Azure OpenAI.-
MCP_LLM_AZURE_OPENAI_ENDPOINTТребуется при использовании Azure. Ваша конечная точка ресурса Azure.-
MCP_LLM_OLLAMA_ENDPOINTURL-адрес конечной точки API Ollama.http://localhost:11434
MCP_LLM_OLLAMA_NUM_CTXРазмер контекстного окна для моделей Ollama.32000
Планировщик LLM (MCP_LLM_PLANNER_)Необязательно: Настройки для отдельного LLM для планирования агента. По умолчанию используется Main LLM, если не задано.
MCP_LLM_PLANNER_PROVIDERПоставщик услуг LLM Planner.Основной поставщик LLM
MCP_LLM_PLANNER_MODEL_NAMEНазвание модели Planner LLM.Основная модель LLM
Браузер (MCP_BROWSER_)Общие настройки браузера.
MCP_BROWSER_HEADLESSЗапустить браузер без пользовательского интерфейса (общие настройки).false
MCP_BROWSER_DISABLE_SECURITYОтключите функции безопасности браузера (общая настройка, используйте осторожно).false
MCP_BROWSER_BINARY_PATHПуть к исполняемому файлу Chrome/Chromium.-
MCP_BROWSER_USER_DATA_DIRПуть к каталогу пользовательских данных Chrome.-
MCP_BROWSER_WINDOW_WIDTHШирина окна браузера (в пикселях).1280
MCP_BROWSER_WINDOW_HEIGHTВысота окна браузера (в пикселях).1080
MCP_BROWSER_USE_OWN_BROWSERПодключитесь к браузеру пользователя через URL-адрес CDP.false
MCP_BROWSER_CDP_URLURL-адрес CDP (например, http://localhost:9222 ). Требуется, если MCP_BROWSER_USE_OWN_BROWSER=true .-
MCP_BROWSER_KEEP_OPENОставлять управляемый сервером браузер открытым между вызовами MCP (если MCP_BROWSER_USE_OWN_BROWSER=false ).false
MCP_BROWSER_TRACE_PATHНеобязательно: Каталог для сохранения файлов трассировки Playwright. Если не задано, трассировка в файл отключена.(пусто, трассировка отключена)
Инструмент агента (MCP_AGENT_TOOL_)Настройки для инструмента run_browser_agent .
MCP_AGENT_TOOL_MAX_STEPSМаксимальное количество шагов за один запуск агента.100
MCP_AGENT_TOOL_MAX_ACTIONS_PER_STEPМаксимальное количество действий на шаг агента.5
MCP_AGENT_TOOL_TOOL_CALLING_METHODМетод вызова инструмента ('auto', 'json_schema', 'function_calling').auto
MCP_AGENT_TOOL_MAX_INPUT_TOKENSМаксимальное количество входных токенов для контекста LLM.128000
MCP_AGENT_TOOL_USE_VISIONВключить возможности зрения (анализ снимков экрана).true
MCP_AGENT_TOOL_HEADLESSПереопределить MCP_BROWSER_HEADLESS для этого инструмента (true/false/пусто).(использует общее)
MCP_AGENT_TOOL_DISABLE_SECURITYПереопределить MCP_BROWSER_DISABLE_SECURITY для этого инструмента (true/false/пусто).(использует общее)
MCP_AGENT_TOOL_ENABLE_RECORDINGВключить запись видео в режиме Playwright.false
MCP_AGENT_TOOL_SAVE_RECORDING_PATHНеобязательно: Путь для сохранения записей. Если не задано, запись в файл отключена, даже если ENABLE_RECORDING=true .(пусто, запись отключена)
MCP_AGENT_TOOL_HISTORY_PATHНеобязательно: Каталог для сохранения файлов истории агента JSON. Если не задано, сохранение истории отключено.(пусто, сохранение истории отключено)
Инструмент исследования (MCP_RESEARCH_TOOL_)Настройки инструмента run_deep_research .
MCP_RESEARCH_TOOL_MAX_PARALLEL_BROWSERSМаксимальное количество параллельных экземпляров браузера для глубоких исследований.3
MCP_RESEARCH_TOOL_SAVE_DIRНеобязательно: Базовый каталог для сохранения исследовательских артефактов. Будет добавлен идентификатор задачи. Если не задано, работает в режиме только памяти.None
Пути (MCP_PATHS_)Общие настройки пути.
MCP_PATHS_DOWNLOADSНеобязательно: Каталог для загруженных файлов. Если не задано, постоянные загрузки по указанному пути отключены.(пусто, загрузки отключены)
Сервер (MCP_SERVER_)Настройки, специфичные для сервера.
MCP_SERVER_LOG_FILEПуть к файлу журнала сервера. Пустой для stdout.(пусто, выводит на стандартный вывод)
MCP_SERVER_LOGGING_LEVELУровень ведения журнала ( DEBUG , INFO , WARNING , ERROR , CRITICAL ).ERROR
MCP_SERVER_ANONYMIZED_TELEMETRYВключить/отключить анонимную телеметрию ( true / false ).true
MCP_SERVER_MCP_CONFIGНеобязательно: строка JSON для конфигурации клиента MCP, используемая внутренним контроллером.null

Поддерживаемые поставщики LLM ( MCP_LLM_PROVIDER ): openai , azure_openai , anthropic , google , mistral , ollama , deepseek , openrouter , alibaba , moonshot , unbound

(Полный список всех поддерживаемых переменных среды и их конкретных ключей/конечных точек поставщика см. в .env.example .)

Подключение к собственному браузеру (CDP)

Вместо того чтобы сервер запускал и управлял собственным экземпляром браузера, вы можете подключить его к браузеру Chrome/Chromium, который вы запускаете и управляете самостоятельно.

Шаги:

  1. Запустите Chrome/Chromium с включенной удаленной отладкой: (команды для macOS, Linux, Windows перечислены ранее, например, google-chrome --remote-debugging-port=9222 )
  2. Настройте переменные среды: установите следующие переменные среды:
    MCP_BROWSER_USE_OWN_BROWSER=true MCP_BROWSER_CDP_URL=http://localhost:9222 # Use the same port # Optional: MCP_BROWSER_USER_DATA_DIR=/path/to/your/profile
  3. Запустите сервер MCP или CLI: Запустите сервер ( uv run mcp-server-browser-use ) или CLI ( mcp-browser-cli ... ) как обычно.

Важные соображения:

  • Браузер, запущенный с --remote-debugging-port должен оставаться открытым.
  • Такие настройки, как MCP_BROWSER_HEADLESS и MCP_BROWSER_KEEP_OPEN игнорируются, если MCP_BROWSER_USE_OWN_BROWSER=true .

Разработка

# Install dev dependencies and sync project deps uv sync --dev # Install playwright browsers uv run playwright install # Run MCP server with debugger (Example connecting to own browser via CDP) # 1. Launch Chrome: google-chrome --remote-debugging-port=9222 --user-data-dir="optional/path/to/user/profile" # 2. Run inspector command with environment variables: npx @modelcontextprotocol/inspector@latest \ -e MCP_LLM_GOOGLE_API_KEY=$GOOGLE_API_KEY \ -e MCP_LLM_PROVIDER=google \ -e MCP_LLM_MODEL_NAME=gemini-2.5-flash-preview-04-17 \ -e MCP_BROWSER_USE_OWN_BROWSER=true \ -e MCP_BROWSER_CDP_URL=http://localhost:9222 \ -e MCP_RESEARCH_TOOL_SAVE_DIR=./tmp/dev_research_output \ uv --directory . run mcp-server-browser-use # Note: Change timeout in inspector's config panel if needed (default is 10 seconds) # Run CLI example # Create a .env file with your settings (including MCP_RESEARCH_TOOL_SAVE_DIR) or use environment variables uv run mcp-browser-cli -e .env run-browser-agent "What is the title of example.com?" uv run mcp-browser-cli -e .env run-deep-research "What is the best material for a pan for everyday use on amateur kitchen and dishwasher?"

Поиск неисправностей

  • Ошибка конфигурации при запуске : если приложение не запускается из-за ошибки об отсутствующем параметре, убедитесь, что все обязательные переменные среды (например, MCP_RESEARCH_TOOL_SAVE_DIR ) правильно заданы в вашей среде или файле .env .
  • Конфликты браузеров : если CDP не используется ( MCP_BROWSER_USE_OWN_BROWSER=false ), убедитесь, что не запущены конфликтующие экземпляры Chrome с тем же каталогом пользовательских данных, если указан MCP_BROWSER_USER_DATA_DIR .
  • Проблемы с подключением CDP : Если используется MCP_BROWSER_USE_OWN_BROWSER=true :
    • Убедитесь, что Chrome запущен с --remote-debugging-port .
    • Убедитесь, что порт в MCP_BROWSER_CDP_URL совпадает.
    • Проверьте брандмауэры и убедитесь, что браузер запущен.
  • Ошибки API : дважды проверьте ключи API ( MCP_LLM_<PROVIDER>_API_KEY или MCP_LLM_API_KEY ) и конечные точки (например, MCP_LLM_AZURE_OPENAI_ENDPOINT для Azure).
  • Проблемы со зрением : убедитесь, что MCP_AGENT_TOOL_USE_VISION=true и ваша степень магистра права поддерживает зрение.
  • Проблемы с зависимостями : Запустите uv sync и uv run playwright install .
  • Проблемы с файлами/путями :
    • Если дополнительные функции, такие как сохранение истории, трассировка или загрузки, не работают, убедитесь, что установлены соответствующие переменные пути ( MCP_AGENT_TOOL_HISTORY_PATH , MCP_BROWSER_TRACE_PATH , MCP_PATHS_DOWNLOADS ) и у приложения есть разрешения на запись в эти расположения.
    • Для более глубокого исследования убедитесь, что MCP_RESEARCH_TOOL_SAVE_DIR установлен в допустимом каталоге с возможностью записи.
  • Ведение журнала : Проверьте файл журнала ( MCP_SERVER_LOG_FILE , если установлен) или вывод консоли. Увеличьте MCP_SERVER_LOGGING_LEVEL до DEBUG для получения более подробной информации. Для CLI используйте --log-level DEBUG .

Лицензия

MIT — подробности см. в разделе ЛИЦЕНЗИЯ .

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Облегчает автоматизацию браузера с помощью настраиваемых возможностей и агентских взаимодействий, интегрированных через библиотеку использования браузера.

  1. Функции
    1. Быстрый старт
      1. Основы
      2. Модели интеграции
    2. Инструменты МКП
      1. Синхронные инструменты (ожидание завершения)
    3. Использование CLI
      1. Конфигурация (переменные среды)
        1. Подключение к собственному браузеру (CDP)
          1. Разработка
            1. Поиск неисправностей
              1. Лицензия

                Related MCP Servers

                • A
                  security
                  F
                  license
                  A
                  quality
                  Enables AI agents to interact with web browsers using natural language, featuring automated browsing, form filling, vision-based element detection, and structured JSON responses for systematic browser control.
                  Last updated -
                  1
                  41
                  Python
                  • Linux
                  • Apple
                • A
                  security
                  F
                  license
                  A
                  quality
                  Enables browser automation using Python scripts, offering operations like taking webpage screenshots, retrieving HTML content, and executing JavaScript.
                  Last updated -
                  4
                  18
                  Python
                  • Linux
                • -
                  security
                  F
                  license
                  -
                  quality
                  Enables AI agents to control web browsers via a standardized interface for operations like launching, interacting with, and closing browsers.
                  Last updated -
                  0
                  JavaScript
                • -
                  security
                  A
                  license
                  -
                  quality
                  A browser automation agent that enables Claude to interact with web browsers through the Model Context Protocol, allowing for actions like navigating websites, manipulating elements, and managing browser state.
                  Last updated -
                  2
                  Python
                  MIT License
                  • Apple

                View all related MCP servers

                MCP directory API

                We provide all the information about MCP servers via our MCP API.

                curl -X GET 'https://glama.ai/api/mcp/v1/servers/Saik0s/mcp-browser-use'

                If you have feedback or need assistance with the MCP directory API, please join our Discord server