Argus

Agente de QA exploratorio impulsado por IA. Dale una URL y explorará tu aplicación como un usuario real (haciendo clic en botones, rellenando formularios, probando casos extremos) y encontrará errores que las pruebas programadas pasan por alto.

A diferencia de Playwright o Cypress, no escribes scripts de prueba. Argus descubre errores que no se te ocurrió probar.

Característica principal: Autoverificación

La función estrella de Argus: cada acción se verifica automáticamente. Cuando eliminas un elemento y ves "¡Eliminado!", Argus actualiza la página para comprobar si realmente ha desaparecido. Cuando editas y guardas, Argus verifica que el nuevo valor haya persistido. Ninguna otra herramienta de prueba hace esto automáticamente.

test_form({"email": "test@test.com", "password": "wrong"}, expected_result="validation_error")

→ UNEXPECTED — form accepted input that should have been rejected
  (Auth bypass: any credentials accepted)

test_crud(create_url="/tasks/new", list_url="/tasks", item_data={"title": "Buy milk"})

→ CREATE: [OK] item created and found on list
  EDIT:   [BUG] "Buy milk (edited)" not found — edit did not persist!
  DELETE: [BUG] item still present after refresh — delete is fake!

Inicio rápido (Servidor MCP para Claude Code)

Claude Code se convierte en el cerebro de la IA; no se necesita clave API.

pip install argus-testing
playwright install chromium
claude mcp add argus -- argus-mcp

Luego, en Claude Code:

"Prueba mi aplicación en http://localhost:3000, céntrate en el flujo de pago"

Herramientas MCP (18)

Herramientas compuestas (núcleo: haz más por llamada):

Herramienta	Qué hace
`test_action(index, desc)`	Clic + captura automática del estado antes/después + diferencia + detección de errores
`test_form(fields, submit)`	Rellenar formulario + enviar + verificar éxito/error + detección de errores
`test_crud(create, list, data)`	Ciclo completo de creación/edición/eliminación con autoverificación por paso

Herramientas de escaneo:

Herramienta	Qué hace
`crawl_site(max_pages)`	Rastreo automático de todo el sitio, ejecuta todos los detectores en cada página
`check_links()`	Rastrea enlaces internos, encuentra errores 404/5xx
`check_performance()`	Mide el tiempo de carga, encuentra recursos grandes

Herramientas de bajo nivel (para casos extremos):

Herramienta	Qué hace
`start_session(url)` / `end_session()`	Iniciar/cerrar navegador, generar informe
`get_page_state()`	Ver elementos + texto de página + conteos + notificaciones + meta + a11y
`click` / `type_text` / `select_option` / `navigate` / `go_back` / `scroll_down`	Interacción directa
`screenshot(name)`	Capturar la página actual
`get_errors()`	Ejecutar los 12 detectores pasivos
`verify_action(type, text, url)`	Verificación manual de la persistencia de eliminación/edición

Qué detecta (16 tipos)

Categoría	Qué encuentra
Errores de lógica	Eliminación/edición falsa (dice éxito pero los datos no persistieron), notificaciones engañosas
Errores de tiempo de ejecución	Excepciones de consola, HTTP 4xx/5xx, bloqueos
Problemas de datos	Desajustes de conteo, fechas rotas, NaN, "Cargando..." eterno
Enlaces rotos	Rastrea todos los enlaces internos, encuentra 404 y 5xx
Imágenes rotas	Imágenes que no se pudieron cargar
SEO	Falta de meta descripción, etiquetas OG, jerarquía de encabezados
Accesibilidad	Falta de texto alternativo, entradas sin etiqueta, sin atributo lang
Rendimiento	Cargas lentas (>3s), recursos grandes (>500KB), solicitudes excesivas
Seguridad	Contenido mixto (HTTP en HTTPS), reflexión XSS

Probado en

Sitio	Tipo	Resultado
React.dev	Next.js SPA	2 errores (a11y)
Angular.dev	Angular SPA	1 error (a11y)
Vue.js	Vitepress SPA	1 error (a11y)
TodoMVC Svelte	Svelte SPA	2 errores (SEO, a11y)
Tailwind CSS	Next.js	9 errores (a11y, perf, recursos grandes)
Hacker News	Estático	5 errores (SEO, a11y)
citymedicalaesthetics.com	Estático	8 errores (enlaces rotos, imágenes 404, SEO)
httpbin.org	Estático	5 errores (SEO, a11y)
BuggyTasks (app de prueba)	Starlette	15+ errores (CRUD falso, omisión de autenticación, fechas rotas)

Cero falsos positivos en todos los sitios probados.

Alternativa: CLI independiente

pip install argus-testing
playwright install chromium
export DEEPSEEK_API_KEY=sk-...
argus http://localhost:3000 --model deepseek/deepseek-chat -n 50

Soporta más de 100 modelos a través de LiteLLM.

Requisitos

Python 3.10+
Chromium (instalado automáticamente mediante playwright install chromium)

Licencia

MIT

Argus

Argus

Característica principal: Autoverificación

Inicio rápido (Servidor MCP para Claude Code)

Herramientas MCP (18)

Qué detecta (16 tipos)

Probado en

Alternativa: CLI independiente

Requisitos

Licencia

Resources

Latest Blog Posts

MCP directory API