Argus
Argus
AIを活用した探索的QAエージェント。 URLを与えるだけで、実際のユーザーのようにアプリを探索し、ボタンのクリック、フォームの入力、エッジケースの試行を行い、スクリプト化されたテストでは見逃されるバグを発見します。
PlaywrightやCypressとは異なり、テストスクリプトを書く必要はありません。Argusはテストしようと思いつかなかったバグを発見します。
主要機能: 自動検証
Argusの強力な機能:すべてのアクションが自動的に検証されます。 アイテムを削除して「削除しました!」と表示されたとき、Argusはページをリフレッシュして実際に削除されたかを確認します。編集して保存したとき、Argusは新しい値が永続化されたかを検証します。他のテストツールでこれを自動的に行うものはありません。
test_form({"email": "test@test.com", "password": "wrong"}, expected_result="validation_error")
→ UNEXPECTED — form accepted input that should have been rejected
(Auth bypass: any credentials accepted)test_crud(create_url="/tasks/new", list_url="/tasks", item_data={"title": "Buy milk"})
→ CREATE: [OK] item created and found on list
EDIT: [BUG] "Buy milk (edited)" not found — edit did not persist!
DELETE: [BUG] item still present after refresh — delete is fake!クイックスタート (Claude Code用MCPサーバー)
Claude CodeがAIの頭脳となります。APIキーは不要です。
pip install argus-testing
playwright install chromium
claude mcp add argus -- argus-mcp次にClaude Codeで以下のように入力します:
"Test my app at http://localhost:3000, focus on the checkout flow"
MCPツール (18)
複合ツール (コア — 1回の呼び出しでより多くのことを実行):
ツール | 内容 |
| クリック + 前後の状態の自動キャプチャ + 差分 + バグ検出 |
| フォーム入力 + 送信 + 成功/エラーの検証 + バグ検出 |
| ステップごとの自動検証を含む完全な作成/編集/削除サイクル |
スキャンツール:
ツール | 内容 |
| サイト全体を自動クロールし、すべてのページですべての検出器を実行 |
| 内部リンクをクロールし、404/5xxエラーを検出 |
| ロード時間を測定し、大きなリソースを検出 |
低レベルツール (エッジケース用):
ツール | 内容 |
| ブラウザの起動/終了、レポート生成 |
| 要素 + ページテキスト + カウント + トースト + メタ情報 + a11yの確認 |
| 直接的な操作 |
| 現在のページのキャプチャ |
| 12個のパッシブ検出器すべてを実行 |
| 削除/編集の永続性の手動検証 |
検出内容 (16種類)
カテゴリ | 検出内容 |
ロジックバグ | 偽の削除/編集(成功と表示されるがデータが永続化されていない)、誤解を招くトースト |
ランタイムエラー | コンソール例外、HTTP 4xx/5xx、クラッシュ |
データ問題 | カウントの不一致、壊れた日付、NaN、永遠に続く「読み込み中...」 |
リンク切れ | すべての内部リンクをクロールし、404や5xxを検出 |
壊れた画像 | 読み込みに失敗した画像 |
SEO | メタディスクリプション、OGタグ、見出し階層の欠落 |
アクセシビリティ | altテキストの欠落、ラベルのない入力、lang属性の欠落 |
パフォーマンス | 低速な読み込み (>3秒)、大きなリソース (>500KB)、過剰なリクエスト |
セキュリティ | 混在コンテンツ (HTTPS上のHTTP)、XSSリフレクション |
テスト実績
サイト | タイプ | 結果 |
React.dev | Next.js SPA | 2件のバグ (a11y) |
Angular.dev | Angular SPA | 1件のバグ (a11y) |
Vue.js | Vitepress SPA | 1件のバグ (a11y) |
TodoMVC Svelte | Svelte SPA | 2件のバグ (SEO, a11y) |
Tailwind CSS | Next.js | 9件のバグ (a11y, perf, 大容量リソース) |
Hacker News | 静的 | 5件のバグ (SEO, a11y) |
citymedicalaesthetics.com | 静的 | 8件のバグ (リンク切れ, 404画像, SEO) |
httpbin.org | 静的 | 5件のバグ (SEO, a11y) |
BuggyTasks (テストアプリ) | Starlette | 15件以上のバグ (偽CRUD, 認証バイパス, 壊れた日付) |
テストしたすべてのサイトで誤検知はゼロでした。
代替手段: スタンドアロンCLI
pip install argus-testing
playwright install chromium
export DEEPSEEK_API_KEY=sk-...
argus http://localhost:3000 --model deepseek/deepseek-chat -n 50LiteLLM を介して100以上のモデルをサポートしています。
要件
Python 3.10+
Chromium (
playwright install chromiumで自動インストール)
ライセンス
MIT
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/chriswu727/argus'
If you have feedback or need assistance with the MCP directory API, please join our Discord server