Skip to main content
Glama

MCP Puppeteer Linux Server

MCP-Puppeteer-Linux

Puppeteerを用いたブラウザ自動化機能を提供するモデルコンテキストプロトコル(LLM)サーバー。Linuxディスプレイサーバー(X11およびWayland)をフルサポートしています。このサーバーにより、LLMはWebページとのインタラクション、スクリーンショットの取得、そして実際のブラウザ環境でのJavaScript実行が可能になります。

ディスプレイサーバーのサポート

このフォークは、Linux ディスプレイ サーバーの自動検出と構成を追加します。

  • X11/Waylandの自動検出
  • 動的環境変数の設定
  • さまざまなデスクトップ環境 (GNOME、KDE など) のサポート
  • フォールバックメカニズムと堅牢なエラー処理
  • XWaylandの互換性

コンポーネント

ツール

  • 操り人形師ナビゲート
    • ブラウザで任意のURLに移動する
    • 入力: url (文字列)
  • 操り人形師のスクリーンショット
    • ページ全体または特定の要素のスクリーンショットをキャプチャします
    • 入力:
      • name (文字列、必須): スクリーンショットの名前
      • selector (文字列、オプション):スクリーンショットを撮る要素のCSSセレクター
      • width (数値、オプション、デフォルト:800):スクリーンショットの幅
      • height (数値、オプション、デフォルト:600):スクリーンショットの高さ
  • 操り人形師クリック
    • ページ上の要素をクリック
    • 入力: selector (文字列): クリックする要素の CSS セレクター
  • 操り人形師_hover
    • ページ上の要素をホバーする
    • 入力: selector (文字列): ホバーする要素の CSS セレクター
  • 操り人形師の塗りつぶし
    • 入力フィールドに記入してください
    • 入力:
      • selector (文字列):入力フィールドのCSSセレクター
      • value (文字列): 入力する値
  • 操り人形師の選択
    • SELECTタグで要素を選択する
    • 入力:
      • selector (文字列): 選択する要素の CSS セレクター
      • value (文字列): 選択する値
  • 操り人形師の評価
    • ブラウザコンソールでJavaScriptを実行する
    • 入力: script (文字列): 実行するJavaScriptコード

リソース

サーバーは、次の 2 種類のリソースへのアクセスを提供します。

  1. コンソールログ( console://logs )
    • ブラウザコンソールのテキスト形式の出力
    • ブラウザからのすべてのコンソールメッセージが含まれます
  2. スクリーンショット( screenshot://<name> )
    • キャプチャしたスクリーンショットのPNG画像
    • キャプチャ時に指定したスクリーンショット名からアクセスできます

主な特徴

  • Linux ディスプレイ サーバーのサポートによるブラウザー自動化
  • X11/Waylandの自動検出と設定
  • コンソールログ監視
  • スクリーンショット機能
  • JavaScript実行
  • 基本的なウェブインタラクション(ナビゲーション、クリック、フォームの入力)

構成

クロードデスクトップ構成

{ "mcpServers": { "puppeteer": { "command": "npx", "args": ["ts-node", "/path/to/index.ts"] } } }

インストール

Smithery経由でインストール

Smithery経由で Claude Desktop に Puppeteer Linux を自動的にインストールするには:

npx -y @smithery/cli install @PhialsBasement/mcp-puppeteer-linux --client claude

手動インストール

  1. リポジトリをクローンします。
git clone https://github.com/PhialsBasement/MCP-Puppeteer-Linux.git
  1. 依存関係をインストールします:
npm install
  1. サーバーを起動します。
ts-node index.ts

サーバーの詳細を表示

サーバーは適切な表示環境を自動的に検出し、構成します。

Wayland サポート

  • WAYLAND_DISPLAY経由で Wayland セッションを検出します
  • 必要な環境変数を設定します。
    • WAYLAND_DISPLAY
    • QT_QPA_PLATFORM
    • GDK_BACKEND
    • MOZ_ENABLE_WAYLAND
    • XDG_SESSION_TYPE

X11 サポート

  • 従来の X11 セッションのフォールバック
  • X11 固有の変数を処理します。
    • DISPLAY
    • XAUTHORITY
  • さまざまなデスクトップ環境とウィンドウマネージャーをサポート

ライセンス

このMCPサーバーはMITライセンスに基づいてライセンスされています。つまり、MITライセンスの条件に従って、ソフトウェアを自由に使用、改変、配布することができます。詳細については、プロジェクトリポジトリのLICENSEファイルをご覧ください。

You must be authenticated.

A
security – no known vulnerabilities
F
license - not found
A
quality - confirmed to work

local-only server

The server can only run on the client's local machine because it depends on local resources.

Linux ディスプレイ サーバー上の LLM のブラウザー自動化を有効にし、実際のブラウザーでの Web 対話、スクリーンショット、および JavaScript 実行をサポートします。

  1. ディスプレイサーバーのサポート
    1. コンポーネント
      1. ツール
      2. リソース
    2. 主な特徴
      1. 構成
        1. クロードデスクトップ構成
      2. インストール
        1. Smithery経由でインストール
        2. 手動インストール
      3. サーバーの詳細を表示
        1. Wayland サポート
        2. X11 サポート
      4. ライセンス

        Related MCP Servers

        • A
          security
          A
          license
          A
          quality
          Enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a real browser environment
          Last updated -
          10
          327
          85
          JavaScript
          MIT License
          • Apple
        • A
          security
          A
          license
          A
          quality
          This server provides cloud browser automation capabilities using Browserbase, Puppeteer, and Stagehand. This server enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a cloud browser environment.
          Last updated -
          8
          502
          1,788
          TypeScript
          Apache 2.0
        • A
          security
          F
          license
          A
          quality
          A server that enables browser automation using Playwright, allowing interaction with web pages, capturing screenshots, and executing JavaScript in a browser environment through LLMs.
          Last updated -
          12
          9,457
          1
          TypeScript
        • A
          security
          F
          license
          A
          quality
          Enables LLMs to perform web browsing tasks, take screenshots, and execute JavaScript using Puppeteer for browser automation.
          Last updated -
          4
          15,502
          1
          JavaScript

        View all related MCP servers

        MCP directory API

        We provide all the information about MCP servers via our MCP API.

        curl -X GET 'https://glama.ai/api/mcp/v1/servers/PhialsBasement/MCP-Puppeteer-Linux'

        If you have feedback or need assistance with the MCP directory API, please join our Discord server