agentmem

Memoria compartida para Claude Code, Cursor y Codex que sabe qué sigue siendo cierto. Guarda sesiones, detecta reglas obsoletas y conflictivas, y evita que tu agente repita errores antiguos.

PyPI Python License: MIT Tests

El problema

Tu asistente de codificación IA olvida todo entre sesiones. Repite errores antiguos. No puede distinguir las reglas actuales de las obsoletas. El contexto se comprime y la recuperación es dolorosa.

La mayoría de las herramientas de memoria resuelven el almacenamiento. agentmem resuelve la confianza.

Empezar (Claude Code / Cursor / Codex)

pip install quilmem[mcp]
agentmem init --tool claude --project myapp

Eso es todo. Reinicia tu editor. Tu agente ahora tiene 13 herramientas de memoria. Ejecuta memory_health para confirmar.

¿Solo Python? pip install quilmem funciona sin el extra MCP. Consulta la API de Python a continuación.

Demo de 60 segundos

from agentmem import Memory

mem = Memory()

# Store typed memories
mem.add(type="bug", title="loudnorm undoes SFX levels",
        content="Never apply loudnorm to final mix. It re-normalizes everything.",
        status="validated")

mem.add(type="decision", title="Use per-line atempo",
        content="Bake speed into per-line TTS. No global pass.",
        status="active")

# Something you're not sure about yet
hypothesis = mem.add(type="decision", title="Maybe try 2-second gaps before CTA",
        content="Hypothesis from last session. Needs testing.",
        status="hypothesis")

# Search — validated and active memories rank highest.
# Deprecated and superseded memories are excluded automatically.
results = mem.search("audio mixing")

# Context-budgeted recall — fits the best memories into your token limit
context = mem.recall("building a narration track", max_tokens=2000)

# Lifecycle — promote what's proven, deprecate what's not
mem.promote(hypothesis.id)                # hypothesis -> active -> validated
mem.deprecate(hypothesis.id, reason="Disproven by data")

# Supersede: replace an outdated memory with a newer one
replacement = mem.add(type="decision", title="Use 1-second gaps before CTA",
        content="Confirmed by A/B test.", status="active")
mem.supersede(hypothesis.id, replacement.id)  # old points to replacement

# Health check — is your memory system trustworthy?
from agentmem import health_check
report = health_check(mem._conn)
# Health: 85/100 | Conflicts: 0 | Stale: 2 | Validated: 14

Qué hace esto diferente

Otras herramientas de memoria almacenan cosas. agentmem sabe qué sigue siendo cierto.

	Mem0	Letta	Mengram	agentmem
Almacenamiento de memoria	Sí	Sí	Sí	Sí
Búsqueda de texto completo	Vector	Basado en agente	Grafo de conocimiento	FTS5
Estados del ciclo de vida de la memoria	No	Parcial	No	hipótesis -> activo -> validado -> obsoleto -> reemplazado
Detección de conflictos	No	No	Parcial	Integrada
Detección de obsolescencia	No	No	No	Integrada
Puntuación de salud	No	No	No	Integrada
Seguimiento de procedencia	No	No	No	source_path + source_hash
Recuperación clasificada por confianza	No	No	No	Validado > activo > hipótesis
Archivos fuente legibles por humanos	No	No	No	Markdown canónico
Local-first, infraestructura cero	No	Opción auto-alojada	Opción auto-alojada	Sí, siempre
Servidor MCP	Separado	Separado	Sí	Integrado

Gobernanza de la verdad

La idea central: cada memoria tiene un estado que rastrea cuánto deberías confiar en ella.

hypothesis    New observation. Not yet confirmed. Lowest trust in recall.
    |
  active      Default. Currently believed true. Normal trust.
    |
 validated    Explicitly confirmed. Highest trust in recall.

 deprecated   Was true, no longer. Excluded from recall. Kept for history.
 superseded   Replaced by a newer memory. Points to replacement.

Por qué importa esto: Sin gobernanza, la memoria de tu agente acumula reglas obsoletas, contradicciones y decisiones desactualizadas. No sabe que la configuración de voz de enero fue anulada en marzo. Recupera ambas y el LLM elige al azar. La memoria gobernada resuelve esto.

Detección de conflictos

from agentmem import detect_conflicts

conflicts = detect_conflicts(mem._conn)
# Found 2 conflict(s):
#   !! [decision] "Always apply loudnorm to voice"
#      vs [decision] "NEVER apply loudnorm to voice"
#      Contradiction on shared topic (voice, loudnorm, audio)

agentmem encuentra memorias que se contradicen entre sí:

Detecta superposición de temas (similitud de Jaccard)
Separa duplicados de contradicciones
Coincidencia de negación a nivel de oración (no solo escaneo de palabras clave)
Severidad: critical (ambas activas) vs warning (una obsoleta)

Detección de obsolescencia

from agentmem import detect_stale

stale = detect_stale(mem._conn, stale_days=30)
# [decision] "Use atempo 0.90" — Source changed since import (hash mismatch)
# [bug] "Firewall blocks port" — Not updated in 45 days

Encuentra memorias obsoletas mediante:

Antigüedad (no actualizada en N días)
Archivo fuente faltante (el archivo referenciado fue eliminado)
Deriva de hash (el contenido del archivo fuente cambió pero la memoria no se actualizó)

Comprobación de salud

from agentmem import health_check

report = health_check(mem._conn)
print(f"Health: {report.health_score}/100")
print(f"Conflicts: {len(report.conflicts)}")
print(f"Stale: {len(report.stale)}")

Puntúa tu sistema de memoria de 0 a 100 basado en: conflictos, porcentaje de obsolescencia, referencias huérfanas, peso de elementos obsoletos y si tienes alguna memoria validada.

Sincronización consciente de la procedencia

Sincroniza archivos markdown canónicos en la base de datos con seguimiento de origen:

# Each memory tracks where it came from
mem.add(type="bug", title="loudnorm lifts noise",
        content="...",
        source_path="/docs/errors.md",
        source_section="Audio Bugs",
        source_hash="a1b2c3d4e5f6")

El motor de sincronización:

Mismo hash = omitir (idempotente, volver a ejecutar no cambia nada)
Hash diferente = actualizar (el archivo fuente cambió)
Sección eliminada = marcar como obsoleto (con motivo)
Sección restaurada = resucitar (reactiva la memoria obsoleta)

Tres interfaces

API de Python

from agentmem import Memory

mem = Memory("./my-agent.db", project="frontend")

# CRUD
record = mem.add(type="decision", title="Use TypeScript", content="...")
mem.get(record.id)
mem.update(record.id, content="Updated reasoning.")
mem.delete(record.id)
mem.list(type="bug", limit=20)

# Search + recall
results = mem.search("typescript migration", type="decision")
context = mem.recall("setting up the build", max_tokens=3000)

# Governance
mem.promote(record.id)              # hypothesis -> active -> validated
mem.deprecate(record.id, reason="No longer relevant")
replacement = mem.add(type="decision", title="Use v2 approach", content="...")
mem.supersede(record.id, replacement.id)  # links old to replacement

# Session persistence
mem.save_session("Working on auth refactor. Blocked on token refresh.")
mem.load_session()                  # picks up where last instance left off

# Health
mem.stats()

CLI

# Get started in 30 seconds
agentmem init --tool claude --project myapp

# Check if everything's working
agentmem doctor

# Core
agentmem add --type bug --title "CSS grid issue" "Flexbox fallback needed"
agentmem search "grid layout"
agentmem recall "frontend styling" --tokens 2000

# Governance
agentmem promote <id>
agentmem deprecate <id> --reason "Fixed in v2.3"
agentmem health
agentmem conflicts
agentmem stale --days 14

# Import + sessions
agentmem import ./errors.md --type bug
agentmem save-session "Finished auth module, starting tests"
agentmem load-session

# MCP server
agentmem serve

Servidor MCP

Servidor Model Context Protocol integrado para Claude Code, Cursor y cualquier cliente MCP.

pip install quilmem[mcp]

Configuración de Claude Code (.claude/settings.json):

{
  "mcpServers": {
    "agentmem": {
      "command": "agentmem",
      "args": ["--db", "./memory.db", "--project", "myproject", "serve"],
      "type": "stdio"
    }
  }
}

Herramientas MCP: add_memory, search_memory, recall_memory, update_memory, delete_memory, list_memories, save_session, load_session, promote_memory, deprecate_memory, supersede_memory, memory_health, memory_conflicts

Dile a tu agente cómo usar la memoria: Copia las instrucciones del agente en tu CLAUDE.md, .cursorrules o AGENTS.md. Esto enseña a tu agente el protocolo de sesión, la jerarquía de confianza y cuándo buscar vs añadir.

Memoria tipada

Siete tipos que cubren flujos de trabajo reales de agentes:

Tipo	Qué almacena	Ejemplo
`setting`	Configuración, parámetros	"Velocidad de voz: atempo 1.08"
`bug`	Errores y sus correcciones	"loudnorm eleva el ruido de fondo"
`decision`	Reglas, políticas, elecciones	"Narración en 3ª persona prohibida"
`procedure`	Flujos de trabajo, tuberías	"TTS -> velocidad -> 48kHz -> mezcla"
`context`	Conocimiento de fondo	"El proyecto usa FFmpeg + Python 3.11"
`feedback`	Correcciones del usuario	"Siempre elige, no preguntes"
`session`	Estado de trabajo actual	"Trabajando en auth. Bloqueado en tokens."

Recuperación clasificada por confianza

recall() no solo encuentra memorias relevantes. Encuentra las memorias relevantes más confiables:

La búsqueda FTS5 devuelve candidatos
Cada uno puntuado: relevancia (25%) + estado de confianza (20%) + procedencia (20%) + recencia (15%) + frecuencia (10%) + confianza (10%)
Las memorias canónicas validadas se clasifican por encima de las memorias de hipótesis sin procedencia
Las memorias obsoletas y reemplazadas se excluyen por completo
Empaquetado de forma codiciosa en tu presupuesto de tokens

Alcance del proyecto

frontend = Memory("./shared.db", project="frontend")
backend = Memory("./shared.db", project="backend")

frontend.search("bug")  # Only frontend bugs
backend.search("bug")   # Only backend bugs

Probado en batalla

Esto no es teórico. agentmem fue construido bajo presión de producción durante más de 2 meses de uso diario:

Más de 65 YouTube Shorts producidos con cero errores de producción repetidos
Más de 330 memorias gobernando la generación de voz, ensamblaje FFmpeg, prompts de imagen, flujos de trabajo de carga
Cada error detectado una vez, corregido una vez, nunca repetido
El motor de gobernanza redujo los conflictos de 1,848 falsos positivos a 11 hallazgos reales

Cómo funciona

Almacenamiento: SQLite con modo WAL (lecturas concurrentes, seguro para hilos)
Búsqueda: FTS5 con stemming de Porter y tokenizador unicode61
Clasificación: Puntuación compuesta: relevancia de texto + estado de confianza + procedencia + recencia + frecuencia + confianza
Gobernanza: Ciclo de vida de estado, detección de conflictos, detección de obsolescencia, puntuación de salud
Sincronización: Consciente de la procedencia con hashing de fuente y resurrección
Infraestructura cero: Sin claves API, sin nube, sin base de datos vectorial. Solo un archivo .db.

Licencia

MIT

agentmem

agentmem

El problema

Empezar (Claude Code / Cursor / Codex)

Demo de 60 segundos

Qué hace esto diferente

Gobernanza de la verdad

Detección de conflictos

Detección de obsolescencia

Comprobación de salud

Sincronización consciente de la procedencia

Tres interfaces

API de Python

CLI

Servidor MCP

Memoria tipada

Recuperación clasificada por confianza

Alcance del proyecto

Probado en batalla

Cómo funciona

Licencia

Resources

Tools

Latest Blog Posts

MCP directory API