Skip to main content
Glama

Argus

AIを活用した探索的QAエージェント。 URLを与えるだけで、実際のユーザーのようにアプリを探索し、ボタンのクリック、フォームの入力、エッジケースの試行を行い、スクリプト化されたテストでは見逃されるバグを発見します。

PlaywrightやCypressとは異なり、テストスクリプトを書く必要はありません。Argusはテストしようと思いつかなかったバグを発見します。

主要機能: 自動検証

Argusの強力な機能:すべてのアクションが自動的に検証されます。 アイテムを削除して「削除しました!」と表示されたとき、Argusはページをリフレッシュして実際に削除されたかを確認します。編集して保存したとき、Argusは新しい値が永続化されたかを検証します。他のテストツールでこれを自動的に行うものはありません。

test_form({"email": "test@test.com", "password": "wrong"}, expected_result="validation_error")

→ UNEXPECTED — form accepted input that should have been rejected
  (Auth bypass: any credentials accepted)
test_crud(create_url="/tasks/new", list_url="/tasks", item_data={"title": "Buy milk"})

→ CREATE: [OK] item created and found on list
  EDIT:   [BUG] "Buy milk (edited)" not found — edit did not persist!
  DELETE: [BUG] item still present after refresh — delete is fake!

クイックスタート (Claude Code用MCPサーバー)

Claude CodeがAIの頭脳となります。APIキーは不要です。

pip install argus-testing
playwright install chromium
claude mcp add argus -- argus-mcp

次にClaude Codeで以下のように入力します:

"Test my app at http://localhost:3000, focus on the checkout flow"

MCPツール (18)

複合ツール (コア — 1回の呼び出しでより多くのことを実行):

ツール

内容

test_action(index, desc)

クリック + 前後の状態の自動キャプチャ + 差分 + バグ検出

test_form(fields, submit)

フォーム入力 + 送信 + 成功/エラーの検証 + バグ検出

test_crud(create, list, data)

ステップごとの自動検証を含む完全な作成/編集/削除サイクル

スキャンツール:

ツール

内容

crawl_site(max_pages)

サイト全体を自動クロールし、すべてのページですべての検出器を実行

check_links()

内部リンクをクロールし、404/5xxエラーを検出

check_performance()

ロード時間を測定し、大きなリソースを検出

低レベルツール (エッジケース用):

ツール

内容

start_session(url) / end_session()

ブラウザの起動/終了、レポート生成

get_page_state()

要素 + ページテキスト + カウント + トースト + メタ情報 + a11yの確認

click / type_text / select_option / navigate / go_back / scroll_down

直接的な操作

screenshot(name)

現在のページのキャプチャ

get_errors()

12個のパッシブ検出器すべてを実行

verify_action(type, text, url)

削除/編集の永続性の手動検証

検出内容 (16種類)

カテゴリ

検出内容

ロジックバグ

偽の削除/編集(成功と表示されるがデータが永続化されていない)、誤解を招くトースト

ランタイムエラー

コンソール例外、HTTP 4xx/5xx、クラッシュ

データ問題

カウントの不一致、壊れた日付、NaN、永遠に続く「読み込み中...」

リンク切れ

すべての内部リンクをクロールし、404や5xxを検出

壊れた画像

読み込みに失敗した画像

SEO

メタディスクリプション、OGタグ、見出し階層の欠落

アクセシビリティ

altテキストの欠落、ラベルのない入力、lang属性の欠落

パフォーマンス

低速な読み込み (>3秒)、大きなリソース (>500KB)、過剰なリクエスト

セキュリティ

混在コンテンツ (HTTPS上のHTTP)、XSSリフレクション

テスト実績

サイト

タイプ

結果

React.dev

Next.js SPA

2件のバグ (a11y)

Angular.dev

Angular SPA

1件のバグ (a11y)

Vue.js

Vitepress SPA

1件のバグ (a11y)

TodoMVC Svelte

Svelte SPA

2件のバグ (SEO, a11y)

Tailwind CSS

Next.js

9件のバグ (a11y, perf, 大容量リソース)

Hacker News

静的

5件のバグ (SEO, a11y)

citymedicalaesthetics.com

静的

8件のバグ (リンク切れ, 404画像, SEO)

httpbin.org

静的

5件のバグ (SEO, a11y)

BuggyTasks (テストアプリ)

Starlette

15件以上のバグ (偽CRUD, 認証バイパス, 壊れた日付)

テストしたすべてのサイトで誤検知はゼロでした。

代替手段: スタンドアロンCLI

pip install argus-testing
playwright install chromium
export DEEPSEEK_API_KEY=sk-...
argus http://localhost:3000 --model deepseek/deepseek-chat -n 50

LiteLLM を介して100以上のモデルをサポートしています。

要件

  • Python 3.10+

  • Chromium (playwright install chromium で自動インストール)

ライセンス

MIT

-
security - not tested
A
license - permissive license
-
quality - not tested

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/chriswu727/argus'

If you have feedback or need assistance with the MCP directory API, please join our Discord server