mcp-helm
mcp-helm
Claude에서 실제 Chrome 세션을 제어하세요 — 핸드오프 인지 기능이 포함된 코파일럿 모드입니다.
대부분의 브라우저 자동화 MCP 서버는 새로운 Playwright Chromium을 실행합니다. 하지만 "Stripe에 로그인하고 5가지를 클릭"하는 작업에서는 쿠키, 2FA, 북마크가 없기 때문에 쓸모가 없습니다. mcp-helm은 귀하의 Chrome에 연결하여, 이미 로그인된 상태에서 Claude가 활성 탭에 대해 작은 도구 세트를 실행할 수 있게 합니다.
또한 언제 물러나야 할지도 알고 있습니다. 페이지에 2FA 프롬프트, 캡차, 결제 확인 또는 생체 인식 요청이 표시되면 스크린샷 도구가 이를 플래그로 지정하고 Claude는 handoff()를 호출하여 사용자를 기다릴 수 있습니다.
왜 이 도구가 필요한가요?
눈과 손의 문제: Claude가 "설정 → API 액세스 클릭"이라고 말하지만, 설정을 클릭해도 API 액세스가 없는 경우, 다시 스크린샷을 찍어 Claude에게 보내면 Claude가 다시 추측합니다. 이는 5초짜리 작업을 위해 5분 동안 왕복하는 셈이며, Stripe / Apple / Play Console / Cloudflare / Vercel 설정 시마다 발생합니다.
mcp-helm은 이 루프를 끊습니다. Claude는 실제 페이지를 보고, 접근성 트리에서 요소를 선택하며(좌표 추측 없음), 해서는 안 될 작업을 수행할 때는 멈춥니다.
설치
npm install -g mcp-helm~/.claude.json(또는 MCP 클라이언트 설정)에 추가하세요:
{
"mcpServers": {
"helm": {
"command": "mcp-helm"
}
}
}사용법
1. 제어 가능한 Chrome 실행
쉘 rc 파일에 다음 별칭을 추가하세요:
alias chrome-pilot='open -a "Google Chrome" --args --remote-debugging-port=9222 --user-data-dir=$HOME/.chrome-pilot'한 번 실행하세요: chrome-pilot. 별도의 Chrome 프로필이 열립니다. Claude가 제어하기를 원하는 모든 서비스(Play Console, Stripe 등)에 로그인하세요. 쿠키는 실행 후에도 유지되므로 서비스당 한 번만 로그인하면 됩니다.
왜 별도의 프로필인가요? 메인 Chrome은 이미 실행 중인 상태에서는 원격 디버깅 모드로 실행할 수 없습니다. 전용 프로필은
~/.chrome-pilot에 저장되며 일상적인 브라우징과 분리됩니다.
2. Claude에서 사용
You: Upload the AAB at <path> to Play Store internal testing.
Claude: [calls helm.attach] → [helm.navigate to play.google.com/console]
[helm.screenshot] → sees the dashboard
[helm.click "Personalized AI Portfolio Bot"]
... etc2FA 프롬프트가 나타나면 screenshot은 handoffTriggers: ["2FA prompt"]를 반환하고 Claude는 handoff를 호출하여 대기합니다.
도구
도구 | 목적 |
| 포트 9222에서 Chrome에 연결합니다. 항상 가장 먼저 호출하세요. |
| 열려 있는 모든 탭을 나열합니다. |
| 인덱스 또는 URL 하위 문자열로 활성 탭을 전환합니다. |
| PNG + URL + 제목 + 감지된 핸드오프 트리거를 반환합니다. |
| 상호작용 가능한 요소의 번호 매겨진 목록(a11y 트리)을 표시합니다. |
| ID(inspect에서 확인), 텍스트 또는 CSS 선택자로 클릭합니다. 스크린샷 차이에서 |
| 필드에 입력합니다. |
| URL로 이동합니다. |
| 텍스트나 선택자를 기다립니다. |
| 일시 중지하고 사용자에게 제어를 넘깁니다. |
설계 선택
좌표가 아닌 접근성 트리 사용. 시각 기반 클릭(Anthropic 컴퓨터 사용)은 훌륭하지만 Retina 디스플레이와 높은 DPR 스케일링에서는 불안정합니다. a11y 트리는 안정적이고 의미론적인 ID를 제공하며, 이는 스크린 리더가 사용하는 방식입니다.
클릭할 때마다 스크린샷 차이 확인.
changed: false라면 클릭이 아무런 동작을 하지 않은 것입니다. Claude가 성공했다고 잘못 보고하는 것을 방지합니다.핸드오프 감지는 LLM 기반이 아닌 정규식 기반. 저렴하고 빠르며, 일반적인 로그인 문구에서 오탐지가 없습니다.
탭 관리 휴리스틱 없음.
attach는 첫 번째 빈 탭이 아닌 탭을 선택합니다. 정확한 제어를 위해list_tabs+focus_tab을 사용하세요. 예측 가능성이 영리함보다 낫습니다.
상태
v0.1 — 간단한 흐름(Play Console, Stripe 대시보드, Vercel, Cloudflare)에서 작동합니다. 아직 처리하지 못하는 예외 사례:
Shadow DOM 컴포넌트(일부 웹 컴포넌트 위주의 사이트)
iframe(프레임 전환 노출 필요)
디스크에서 파일 업로드
Enter 키 이외의 키보드 단축키
라이선스
MIT
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/flying-pisces/mcp-helm'
If you have feedback or need assistance with the MCP directory API, please join our Discord server