Skip to main content
Glama

mcp-helm

从 Claude 控制您真实的 Chrome 会话 —— 带有移交感知功能的副驾驶模式。

大多数浏览器自动化 MCP 服务器会启动一个全新的 Playwright Chromium。当工作是“登录 Stripe 并点击 5 个东西”时,这毫无用处——因为您没有您的 Cookie、2FA 和书签。mcp-helm 会连接到您的 Chrome(即您已经登录的那个),并允许 Claude 对活动标签页运行一组小型工具。

它还知道何时退后:当页面显示 2FA 提示、验证码、付款确认或生物识别请求时,截图工具会标记它,Claude 可以调用 handoff() 来等待您处理。

为什么存在这个工具

“眼高手低”的问题:Claude 告诉您“点击设置 → API 访问”,您点击了设置,但那里没有 API 访问,于是您截图发回给 Claude,它再次猜测。对于一个 5 秒的任务,这需要 5 分钟的往返,而且这种情况发生在每个 Stripe / Apple / Play Console / Cloudflare / Vercel 设置中。

mcp-helm 切断了这个循环。Claude 可以看到实际页面,从辅助功能树中选择元素(无需猜测坐标),并在不该操作时停止。

安装

npm install -g mcp-helm

添加到 ~/.claude.json(或您的 MCP 客户端配置):

{
  "mcpServers": {
    "helm": {
      "command": "mcp-helm"
    }
  }
}

使用方法

1. 启动一个可驱动的 Chrome

将此别名添加到您的 shell rc 文件中:

alias chrome-pilot='open -a "Google Chrome" --args --remote-debugging-port=9222 --user-data-dir=$HOME/.chrome-pilot'

运行一次:chrome-pilot。一个单独的 Chrome 配置文件会打开。登录您希望 Claude 驱动的所有内容(Play Console、Stripe 等)。Cookie 会在启动之间持久保存——您只需为每个服务登录一次。

为什么要单独的配置文件? 您的主 Chrome 在已经运行时无法以远程调试模式启动。专用配置文件位于 ~/.chrome-pilot,与您的日常浏览分开。

2. 从 Claude 使用

You: Upload the AAB at <path> to Play Store internal testing.
Claude: [calls helm.attach] → [helm.navigate to play.google.com/console]
        [helm.screenshot] → sees the dashboard
        [helm.click "Personalized AI Portfolio Bot"]
        ... etc

如果出现 2FA 提示,screenshot 会返回 handoffTriggers: ["2FA prompt"],Claude 会调用 handoff 来等待。

工具

工具

用途

attach

连接到端口 9222 上的 Chrome。请务必首先调用。

list_tabs

列出所有打开的标签页。

focus_tab

通过索引或 URL 子字符串切换活动标签页。

screenshot

PNG + URL + 标题 + 检测到的移交触发条件。

inspect

交互式元素的编号列表(辅助功能树)。

click

通过 ID(来自 inspect)、文本或 CSS 选择器点击。返回来自截图差异的 changed: bool

type

在字段中输入。submit: true 会在输入后按下回车键。

navigate

前往 URL。

wait_for

等待文本或选择器。

handoff

暂停并请求人工接管。

设计选择

  • 辅助功能树,而非坐标。 基于视觉的点击(Anthropic 计算机使用)很棒,但在 Retina 显示屏和高 DPR 缩放上不稳定。辅助功能树提供了稳定的语义 ID——这也是屏幕阅读器所使用的。

  • 每次点击后进行截图差异对比。 如果 changed: false,则点击无效。这可以防止 Claude 愉快地报告成功。

  • 移交检测基于正则表达式,而非 LLM。 廉价、快速,且在常见的登录短语上不会出现误报。

  • 没有标签页管理启发式算法。 attach 会选择第一个非空白标签页;使用 list_tabs + focus_tab 来实现精确控制。可预测性胜过聪明才智。

状态

v0.1 — 适用于简单流程(Play Console、Stripe 仪表板、Vercel、Cloudflare)。尚未处理的边缘情况:

  • Shadow DOM 组件(一些大量使用 Web 组件的网站)

  • iframe(需要实现框架切换)

  • 从磁盘上传文件

  • 除回车键之外的键盘快捷键

许可证

MIT

Install Server
A
license - permissive license
A
quality
C
maintenance

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/flying-pisces/mcp-helm'

If you have feedback or need assistance with the MCP directory API, please join our Discord server