Skip to main content
Glama

Argus

Agente de QA exploratorio impulsado por IA. Dale una URL y explorará tu aplicación como un usuario real (haciendo clic en botones, rellenando formularios, probando casos extremos) y encontrará errores que las pruebas programadas pasan por alto.

A diferencia de Playwright o Cypress, no escribes scripts de prueba. Argus descubre errores que no se te ocurrió probar.

Característica principal: Autoverificación

La función estrella de Argus: cada acción se verifica automáticamente. Cuando eliminas un elemento y ves "¡Eliminado!", Argus actualiza la página para comprobar si realmente ha desaparecido. Cuando editas y guardas, Argus verifica que el nuevo valor haya persistido. Ninguna otra herramienta de prueba hace esto automáticamente.

test_form({"email": "test@test.com", "password": "wrong"}, expected_result="validation_error")

→ UNEXPECTED — form accepted input that should have been rejected
  (Auth bypass: any credentials accepted)
test_crud(create_url="/tasks/new", list_url="/tasks", item_data={"title": "Buy milk"})

→ CREATE: [OK] item created and found on list
  EDIT:   [BUG] "Buy milk (edited)" not found — edit did not persist!
  DELETE: [BUG] item still present after refresh — delete is fake!

Inicio rápido (Servidor MCP para Claude Code)

Claude Code se convierte en el cerebro de la IA; no se necesita clave API.

pip install argus-testing
playwright install chromium
claude mcp add argus -- argus-mcp

Luego, en Claude Code:

"Prueba mi aplicación en http://localhost:3000, céntrate en el flujo de pago"

Herramientas MCP (18)

Herramientas compuestas (núcleo: haz más por llamada):

Herramienta

Qué hace

test_action(index, desc)

Clic + captura automática del estado antes/después + diferencia + detección de errores

test_form(fields, submit)

Rellenar formulario + enviar + verificar éxito/error + detección de errores

test_crud(create, list, data)

Ciclo completo de creación/edición/eliminación con autoverificación por paso

Herramientas de escaneo:

Herramienta

Qué hace

crawl_site(max_pages)

Rastreo automático de todo el sitio, ejecuta todos los detectores en cada página

check_links()

Rastrea enlaces internos, encuentra errores 404/5xx

check_performance()

Mide el tiempo de carga, encuentra recursos grandes

Herramientas de bajo nivel (para casos extremos):

Herramienta

Qué hace

start_session(url) / end_session()

Iniciar/cerrar navegador, generar informe

get_page_state()

Ver elementos + texto de página + conteos + notificaciones + meta + a11y

click / type_text / select_option / navigate / go_back / scroll_down

Interacción directa

screenshot(name)

Capturar la página actual

get_errors()

Ejecutar los 12 detectores pasivos

verify_action(type, text, url)

Verificación manual de la persistencia de eliminación/edición

Qué detecta (16 tipos)

Categoría

Qué encuentra

Errores de lógica

Eliminación/edición falsa (dice éxito pero los datos no persistieron), notificaciones engañosas

Errores de tiempo de ejecución

Excepciones de consola, HTTP 4xx/5xx, bloqueos

Problemas de datos

Desajustes de conteo, fechas rotas, NaN, "Cargando..." eterno

Enlaces rotos

Rastrea todos los enlaces internos, encuentra 404 y 5xx

Imágenes rotas

Imágenes que no se pudieron cargar

SEO

Falta de meta descripción, etiquetas OG, jerarquía de encabezados

Accesibilidad

Falta de texto alternativo, entradas sin etiqueta, sin atributo lang

Rendimiento

Cargas lentas (>3s), recursos grandes (>500KB), solicitudes excesivas

Seguridad

Contenido mixto (HTTP en HTTPS), reflexión XSS

Probado en

Sitio

Tipo

Resultado

React.dev

Next.js SPA

2 errores (a11y)

Angular.dev

Angular SPA

1 error (a11y)

Vue.js

Vitepress SPA

1 error (a11y)

TodoMVC Svelte

Svelte SPA

2 errores (SEO, a11y)

Tailwind CSS

Next.js

9 errores (a11y, perf, recursos grandes)

Hacker News

Estático

5 errores (SEO, a11y)

citymedicalaesthetics.com

Estático

8 errores (enlaces rotos, imágenes 404, SEO)

httpbin.org

Estático

5 errores (SEO, a11y)

BuggyTasks (app de prueba)

Starlette

15+ errores (CRUD falso, omisión de autenticación, fechas rotas)

Cero falsos positivos en todos los sitios probados.

Alternativa: CLI independiente

pip install argus-testing
playwright install chromium
export DEEPSEEK_API_KEY=sk-...
argus http://localhost:3000 --model deepseek/deepseek-chat -n 50

Soporta más de 100 modelos a través de LiteLLM.

Requisitos

  • Python 3.10+

  • Chromium (instalado automáticamente mediante playwright install chromium)

Licencia

MIT

-
security - not tested
A
license - permissive license
-
quality - not tested

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/chriswu727/argus'

If you have feedback or need assistance with the MCP directory API, please join our Discord server