MCP セレンサーバー
Selenium WebDriver 用のモデルコンテキストプロトコル (MCP) サーバー実装。標準化された MCP クライアントを通じてブラウザの自動化を可能にします。
特徴
- カスタマイズ可能なオプションでブラウザセッションを開始する
- URLに移動する
- さまざまなロケーター戦略を使用して要素を検索する
- クリック、入力、要素の操作
- マウス操作を実行する(ホバー、ドラッグ&ドロップ)
- キーボード入力を処理する
- スクリーンショットを撮る
- ファイルをアップロードする
- ヘッドレスモードのサポート
サポートされているブラウザ
- クロム
- ファイアフォックス
グースと一緒に使う
オプション1: ワンクリックインストール
この拡張機能を Goose Desktop に追加するには、以下のリンクをコピーしてブラウザのアドレス バーに貼り付けます。
オプション2: デスクトップまたはCLIに手動で追加する
- 名前:
Selenium MCP
- 説明:
automates browser interactions
- コマンド:
npx -y @angiejones/mcp-selenium
他の MCP クライアント (例: Claude Desktop など) と併用する
発達
このプロジェクトに取り組むには:
- リポジトリをクローンする
- 依存関係をインストール:
npm install
- サーバーを実行します:
npm start
インストール
Smithery経由でインストール
Smithery経由で Claude Desktop 用の MCP Selenium を自動的にインストールするには:
手動インストール
使用法
次のコマンドを実行してサーバーを起動します。
または、MCP 構成で NPX を使用します。
ツール
ブラウザを起動する
ブラウザ セッションを起動します。
パラメータ:
browser
(必須): 起動するブラウザ- タイプ: 文字列
- 列挙型: ["chrome", "firefox"]
options
: ブラウザの設定オプション- タイプ: オブジェクト
- プロパティ:
headless
: ブラウザをヘッドレスモードで実行する- 型: ブール値
arguments
: 追加のブラウザ引数- タイプ: 文字列の配列
例:
ナビゲート
URL に移動します。
パラメータ:
url
(必須): 移動先のURL- タイプ: 文字列
例:
要素を見つける
ページ上の要素を検索します。
パラメータ:
by
(必須): ロケーター戦略- タイプ: 文字列
- 列挙型: ["id", "css", "xpath", "name", "tag", "class"]
value
(必須): ロケータ戦略の値- タイプ: 文字列
timeout
: 要素を待機する最大時間(ミリ秒)- タイプ: 数値
- デフォルト: 10000
例:
クリック要素
要素をクリックします。
パラメータ:
by
(必須): ロケーター戦略- タイプ: 文字列
- 列挙型: ["id", "css", "xpath", "name", "tag", "class"]
value
(必須): ロケータ戦略の値- タイプ: 文字列
timeout
: 要素を待機する最大時間(ミリ秒)- タイプ: 数値
- デフォルト: 10000
例:
送信キー
要素にキーを送信します (入力)。
パラメータ:
by
(必須): ロケーター戦略- タイプ: 文字列
- 列挙型: ["id", "css", "xpath", "name", "tag", "class"]
value
(必須): ロケータ戦略の値- タイプ: 文字列
text
(必須): 要素に入力するテキスト- タイプ: 文字列
timeout
: 要素を待機する最大時間(ミリ秒)- タイプ: 数値
- デフォルト: 10000
例:
要素テキストを取得する
要素の text() を取得します。
パラメータ:
by
(必須): ロケーター戦略- タイプ: 文字列
- 列挙型: ["id", "css", "xpath", "name", "tag", "class"]
value
(必須): ロケータ戦略の値- タイプ: 文字列
timeout
: 要素を待機する最大時間(ミリ秒)- タイプ: 数値
- デフォルト: 10000
例:
ホバー
マウスを移動して要素の上に置きます。
パラメータ:
by
(必須): ロケーター戦略- タイプ: 文字列
- 列挙型: ["id", "css", "xpath", "name", "tag", "class"]
value
(必須): ロケータ戦略の値- タイプ: 文字列
timeout
: 要素を待機する最大時間(ミリ秒)- タイプ: 数値
- デフォルト: 10000
例:
ドラッグアンドドロップ
要素をドラッグして別の要素にドロップします。
パラメータ:
by
(必須): ソース要素のロケータ戦略- タイプ: 文字列
- 列挙型: ["id", "css", "xpath", "name", "tag", "class"]
value
(必須): ソースロケータ戦略の値- タイプ: 文字列
targetBy
(必須): ターゲット要素のロケータ戦略- タイプ: 文字列
- 列挙型: ["id", "css", "xpath", "name", "tag", "class"]
targetValue
(必須): ターゲットロケータ戦略の値- タイプ: 文字列
timeout
: 要素を待機する最大時間(ミリ秒)- タイプ: 数値
- デフォルト: 10000
例:
ダブルクリック
要素をダブルクリックします。
パラメータ:
by
(必須): ロケーター戦略- タイプ: 文字列
- 列挙型: ["id", "css", "xpath", "name", "tag", "class"]
value
(必須): ロケータ戦略の値- タイプ: 文字列
timeout
: 要素を待機する最大時間(ミリ秒)- タイプ: 数値
- デフォルト: 10000
例:
右クリック
要素上で右クリック (コンテキスト クリック) を実行します。
パラメータ:
by
(必須): ロケーター戦略- タイプ: 文字列
- 列挙型: ["id", "css", "xpath", "name", "tag", "class"]
value
(必須): ロケータ戦略の値- タイプ: 文字列
timeout
: 要素を待機する最大時間(ミリ秒)- タイプ: 数値
- デフォルト: 10000
例:
キーを押す
キーボードのキーを押す動作をシミュレートします。
パラメータ:
key
(必須): 押すキー (例: 'Enter'、'Tab'、'a' など)- タイプ: 文字列
例:
アップロードファイル
ファイル入力要素を使用してファイルをアップロードします。
パラメータ:
by
(必須): ロケーター戦略- タイプ: 文字列
- 列挙型: ["id", "css", "xpath", "name", "tag", "class"]
value
(必須): ロケータ戦略の値- タイプ: 文字列
filePath
(必須): アップロードするファイルへの絶対パス- タイプ: 文字列
timeout
: 要素を待機する最大時間(ミリ秒)- タイプ: 数値
- デフォルト: 10000
例:
スクリーンショット
現在のページのスクリーンショットをキャプチャします。
パラメータ:
outputPath
(オプション): スクリーンショットを保存するパス。指定されていない場合は、base64データを返します。- タイプ: 文字列
例:
セッションを閉じる
現在のブラウザ セッションを閉じて、リソースをクリーンアップします。
**パラメータ:**不要
例:
ライセンス
マサチューセッツ工科大学
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
MCP を介して Selenium WebDriver を使用してブラウザーの自動化を可能にし、ブラウザー管理、要素の場所、および基本的および高度なユーザー操作をサポートします。
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityFacilitates browser automation with custom capabilities and agent-based interactions, integrated through the browser-use library.Last updated -1541PythonMIT License
- AsecurityFlicenseAqualityEnables browser automation using Python scripts, offering operations like taking webpage screenshots, retrieving HTML content, and executing JavaScript.Last updated -418Python
- AsecurityAlicenseAqualityEnables browser automation with Puppeteer, supporting navigation, form interactions, and connection to active Chrome instances for comprehensive web page interaction.Last updated -84708TypeScriptMIT License
- -security-license-qualityA tool that enables automated browser control using Pyppeteer within the MCP framework, allowing navigation, screenshot capture, and element interaction with websites.Last updated -PythonApache 2.0