🚀 operative.sh web-eval-agent MCP サーバー
コーディングエージェントに自己デバッグを任せれば、もっとやるべきことがあるはずです。

🔥 デバッグを強化
operative.shの MCP サーバーは、ブラウザベースのエージェントを起動して、コード エディター内で直接 Web アプリを自律的に実行およびデバッグします。
⚡ 特徴
- 🌐 BrowserUse を使用してウェブアプリを操作する(操作可能なバックエンドで 2 倍高速化)
- 📊ネットワークトラフィックをキャプチャ- リクエストはインテリジェントにフィルタリングされ、コンテキストウィンドウに返されます
- 🚨コンソールエラーを収集- ログとエラーをキャプチャします
- 🤖自律デバッグ- カーソル エージェントは Web QA エージェント mcp サーバーを呼び出して、書き込んだコードがエンドツーエンドで期待どおりに動作するかどうかをテストします。
🧰 MCP ツールリファレンス
道具 | 目的 |
---|
web_eval_agent | 🤖 ブラウザを操作し、スクリーンショット、コンソールとネットワークのログをキャプチャし、豊富な UX レポートを返す自動 UX エバリュエーター。 |
setup_browser_state | 🔒 対話型 (非ヘッドレス) ブラウザを開いて一度サインインできるようにします。保存された Cookie/ローカル ストレージは、後続のweb_eval_agent 実行で再利用されます。 |
主な議論
web_eval_agent
url
(必須) – 実行中のアプリのアドレス (例http://localhost:3000
)task
(必須) - テスト対象についての自然言語による説明(「サインアップフローを実行し、UX の問題があればメモする」)headless_browser
(オプション、デフォルトはfalse
) – ブラウザウィンドウを非表示にするにはtrue
に設定します
setup_browser_state
url
(オプション) – 最初に開くページ (ログイン画面に直接アクセスするのに便利)
これらのツールは、IDE チャットから直接起動できます。たとえば、次のようになります。
Evaluate my app at http://localhost:3000 – run web_eval_agent with the task "Try the full signup flow and report UX issues".
🏁 クイックスタート (macOS/Linux)
- 前提条件(通常は必要ありません):
- 醸造:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
- npm: (
brew install npm
) - jq:
brew install jq
- APIキー(無料)を取得した後、インストーラーを実行します。
curl -LSf https://operative.sh/install.sh -o install.sh && bash install.sh && rm install.sh
- お気に入りのIDEにアクセスし、再起動して変更を適用します
- チャットモードでプロンプトを送信して、Web評価エージェントツールを呼び出します。例:
Test my app on http://localhost:3000. Use web-eval-agent.
🛠️ 手動インストール
- operative.shでAPIキーを取得します
- uvをインストールする
curl -LsSf https://astral.sh/uv/install.sh | sh)
- Playwright をインストールします:
npm install -g chromium playwright && uvx --with playwright playwright install --with-deps
- 以下のJSONをAPIキーとともに関連するコードエディターに追加します。
- コードエディタを再起動します
🔃 更新中
uv cache clean
- MCPサーバーを更新する
"web-eval-agent": {
"command": "uvx",
"args": [
"--refresh-package",
"webEvalAgent",
"--from",
"git+https://github.com/Operative-Sh/web-eval-agent.git",
"webEvalAgent"
],
"env": {
"OPERATIVE_API_KEY": "<YOUR_KEY>"
}
}
🛠️ 手動インストール (Mac + Cursor/Cline/Windsurf)
- operative.shでAPIキーを取得します
- uvをインストールする
curl -LsSf https://astral.sh/uv/install.sh | sh)
- Playwright をインストールします:
npm install -g chromium playwright && uvx --with playwright playwright install --with-deps
- 以下のJSONをAPIキーとともに関連するコードエディターに追加します。
- コードエディタを再起動してください
手動インストール(Windows + カーソル/クライン/ウィンドサーフィン)
これを改良中です。問題がある場合は、問題を報告してください。
- これをすべてコードエディタターミナルで実行します
curl -LSf https://operative.sh/install.sh -o install.sh && bash install.sh && rm install.sh
- operative.shでAPIキーを取得します
- uv をインストールします
(curl -LsSf https://astral.sh/uv/install.sh | sh)
uvx --from git+https://github.com/Operative-Sh/web-eval-agent.git playwright install
- コードエディターを再起動
🚨 問題点
- コードエディターで更新が受信されない場合、最新バージョンに更新または再インストールしてください。最新のバージョンにするには
uv cache clean
実行してください。 - 何か問題がございましたら、お気軽にこのリポジトリまたは discord で Issue を開いてください。
- 5/5 - 変更のない静的アプリがスクリーンキャストされない問題を修正しました。UV
uv clean
と再起動で修正されます。
変更履歴
- 4/29 - エージェントオーバーレイの更新 - ブラウザでエージェントの実行を一時停止/再生/停止
📋 MCP サーバー出力レポートの例
📊 Web Evaluation Report for http://localhost:5173 complete!
📝 Task: Test the API-key deletion flow by navigating to the API Keys section, deleting a key, and judging the UX.
🔍 Agent Steps
📍 1. Navigate → http://localhost:5173
📍 2. Click "Login" (button index 2)
📍 3. Click "API Keys" (button index 4)
📍 4. Click "Create Key" (button index 9)
📍 5. Type "Test API Key" (input index 2)
📍 6. Click "Done" (button index 3)
📍 7. Click "Delete" (button index 10)
📍 8. Click "Delete" (confirm index 3)
🏁 Flow tested successfully – UX felt smooth and intuitive.
🖥️ Console Logs (10)
1. [debug] [vite] connecting…
2. [debug] [vite] connected.
3. [info] Download the React DevTools …
…
🌐 Network Requests (10)
1. GET /src/pages/SleepingMasks.tsx 304
2. GET /src/pages/MCPRegistryRegistry.tsx 304
…
⏱️ Chronological Timeline
01:16:23.293 🖥️ Console [debug] [vite] connecting…
01:16:23.303 🖥️ Console [debug] [vite] connected.
01:16:23.312 ➡️ GET /src/pages/SleepingMasks.tsx
01:16:23.318 ⬅️ 304 /src/pages/SleepingMasks.tsx
…
01:17:45.038 🤖 🏁 Flow finished – deletion verified
01:17:47.038 🤖 📋 Conclusion repeated above
👁️ See the "Operative Control Center" dashboard for live logs.
スターの歴史
<3 @ operative.shで構築