Argus
Argus
AI 기반 탐색적 QA 에이전트. URL을 입력하면 실제 사용자처럼 앱을 탐색하여 버튼 클릭, 양식 작성, 엣지 케이스 테스트 등을 수행하며 스크립트 기반 테스트가 놓치는 버그를 찾아냅니다.
Playwright나 Cypress와 달리 테스트 스크립트를 작성할 필요가 없습니다. Argus는 테스트할 생각을 미처 하지 못했던 버그까지 발견합니다.
핵심 기능: 자동 검증
Argus의 강력한 기능: 모든 작업이 자동으로 검증됩니다. 항목을 삭제하고 "삭제되었습니다!"라는 메시지를 확인하면, Argus는 페이지를 새로고침하여 실제로 삭제되었는지 확인합니다. 편집 후 저장하면 Argus는 새로운 값이 유지되는지 검증합니다. 다른 어떤 테스트 도구도 이를 자동으로 수행하지 않습니다.
test_form({"email": "test@test.com", "password": "wrong"}, expected_result="validation_error")
→ UNEXPECTED — form accepted input that should have been rejected
(Auth bypass: any credentials accepted)test_crud(create_url="/tasks/new", list_url="/tasks", item_data={"title": "Buy milk"})
→ CREATE: [OK] item created and found on list
EDIT: [BUG] "Buy milk (edited)" not found — edit did not persist!
DELETE: [BUG] item still present after refresh — delete is fake!빠른 시작 (Claude Code용 MCP 서버)
Claude Code가 AI 두뇌 역할을 하므로 API 키가 필요하지 않습니다.
pip install argus-testing
playwright install chromium
claude mcp add argus -- argus-mcp그런 다음 Claude Code에서:
"http://localhost:3000에서 내 앱을 테스트하고, 결제 흐름에 집중해줘"
MCP 도구 (18개)
복합 도구 (핵심 — 호출당 더 많은 작업 수행):
도구 | 기능 |
| 클릭 + 전/후 상태 자동 캡처 + 차이 분석 + 버그 탐지 |
| 양식 작성 + 제출 + 성공/오류 검증 + 버그 탐지 |
| 단계별 자동 검증을 포함한 전체 생성/편집/삭제 주기 |
스캔 도구:
도구 | 기능 |
| 전체 사이트 자동 크롤링, 모든 페이지에서 모든 탐지기 실행 |
| 내부 링크 크롤링, 404/5xx 오류 찾기 |
| 로드 시간 측정, 대용량 리소스 찾기 |
저수준 도구 (엣지 케이스용):
도구 | 기능 |
| 브라우저 실행/종료, 보고서 생성 |
| 요소 + 페이지 텍스트 + 개수 + 토스트 메시지 + 메타 + 접근성 확인 |
| 직접 상호작용 |
| 현재 페이지 캡처 |
| 12개의 수동 탐지기 모두 실행 |
| 삭제/편집 유지 여부 수동 검증 |
탐지 항목 (16가지 유형)
카테고리 | 탐지 내용 |
로직 버그 | 가짜 삭제/편집(성공 메시지가 뜨지만 데이터가 유지되지 않음), 오해의 소지가 있는 토스트 메시지 |
런타임 오류 | 콘솔 예외, HTTP 4xx/5xx, 충돌 |
데이터 문제 | 개수 불일치, 잘못된 날짜, NaN, 무한 "로딩 중..." |
데드 링크 | 모든 내부 링크 크롤링, 404 및 5xx 오류 찾기 |
깨진 이미지 | 로드에 실패한 이미지 |
SEO | 누락된 메타 설명, OG 태그, 헤딩 계층 구조 |
접근성 | 누락된 alt 텍스트, 레이블 없는 입력란, lang 속성 없음 |
성능 | 느린 로드(>3초), 대용량 리소스(>500KB), 과도한 요청 |
보안 | 혼합 콘텐츠(HTTPS 내 HTTP), XSS 리플렉션 |
테스트 완료 사이트
사이트 | 유형 | 결과 |
React.dev | Next.js SPA | 버그 2개 (접근성) |
Angular.dev | Angular SPA | 버그 1개 (접근성) |
Vue.js | Vitepress SPA | 버그 1개 (접근성) |
TodoMVC Svelte | Svelte SPA | 버그 2개 (SEO, 접근성) |
Tailwind CSS | Next.js | 버그 9개 (접근성, 성능, 대용량 리소스) |
Hacker News | 정적 | 버그 5개 (SEO, 접근성) |
citymedicalaesthetics.com | 정적 | 버그 8개 (데드 링크, 404 이미지, SEO) |
httpbin.org | 정적 | 버그 5개 (SEO, 접근성) |
BuggyTasks (테스트 앱) | Starlette | 버그 15개 이상 (가짜 CRUD, 인증 우회, 잘못된 날짜) |
테스트된 모든 사이트에서 오탐(False Positive) 제로.
대안: 독립형 CLI
pip install argus-testing
playwright install chromium
export DEEPSEEK_API_KEY=sk-...
argus http://localhost:3000 --model deepseek/deepseek-chat -n 50LiteLLM을 통해 100개 이상의 모델을 지원합니다.
요구 사항
Python 3.10+
Chromium (
playwright install chromium을 통해 자동 설치)
라이선스
MIT
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/chriswu727/argus'
If you have feedback or need assistance with the MCP directory API, please join our Discord server