search_memory

Search and retrieve stored memories using text queries, tags, or semantic similarity with configurable filters for date range and relevance scoring.

Instructions

Search for memories with optional filters and scoring.

Args:
    query: Text query to search for.
    tags: Filter by tags.
    top_k: Maximum number of results.
    window_days: Only search memories from last N days.
    min_score: Minimum decay score threshold.
    use_embeddings: Use semantic search with embeddings.

Returns:
    List of matching memories with scores.

Input Schema

TableJSON Schema

Name	Required	Description	Default
`min_score`	No
`query`	No
`tags`	No
`top_k`	No
`use_embeddings`	No
`window_days`	No

Implementation Reference

src/cortexgraph/tools/search.py:90-335 (handler)

The main handler function for the 'search_memory' MCP tool. Decorated with @mcp.tool() for automatic registration and schema inference from type hints and docstring. Implements comprehensive memory search with text/embedding similarity, decay scoring, pagination, content preview, and natural spaced repetition via review candidate blending.

@mcp.tool()
@time_operation("search_memory")
def search_memory(
    query: str | None = None,
    tags: list[str] | None = None,
    top_k: int = 10,
    window_days: int | None = None,
    min_score: float | None = None,
    use_embeddings: bool = False,
    include_review_candidates: bool = True,
    page: int | None = None,
    page_size: int | None = None,
    preview_length: int | None = None,
) -> dict[str, Any]:
    """
    Search for memories with optional filters and scoring.

    This tool implements natural spaced repetition by blending memories due
    for review into results when they're relevant. This creates the "Maslow
    effect" - natural reinforcement through conversation.

    **Content Preview (v0.7.0):** By default, returns first 300 characters of each
    memory to reduce context usage. Pass `preview_length=0` for full content, or
    set a custom length (1-5000 characters).

    **Pagination:** Results are paginated to help you find specific memories across
    large result sets. Use `page` and `page_size` to navigate through results.
    If a search term isn't found on the first page, increment `page` to see more results.

    Args:
        query: Text query to search for (max 50,000 chars).
        tags: Filter by tags (max 50 tags).
        top_k: Maximum number of results before pagination (1-100).
        window_days: Only search memories from last N days (1-3650).
        min_score: Minimum decay score threshold (0.0-1.0).
        use_embeddings: Use semantic search with embeddings.
        include_review_candidates: Blend in memories due for review (default True).
        page: Page number to retrieve (1-indexed, default: 1).
        page_size: Number of memories per page (default: 10, max: 100).
        preview_length: Content preview length in chars (default: 300, 0 = full content).

    Returns:
        Dictionary with paginated results including:
        - results: List of matching memories with scores for current page
        - pagination: Metadata (page, page_size, total_count, total_pages, has_more)

        Some results may be review candidates that benefit from reinforcement.

    Examples:
        # Get first page with previews (default 300 chars)
        search_memory(query="authentication", page=1, page_size=10)

        # Get full content
        search_memory(query="authentication", preview_length=0)

        # Custom preview length
        search_memory(query="authentication", preview_length=500)

    Raises:
        ValueError: If any input fails validation.
    """
    # Input validation
    if query is not None:
        query = validate_string_length(query, MAX_CONTENT_LENGTH, "query", allow_none=True)

    if tags is not None:
        tags = validate_list_length(tags, MAX_TAGS_COUNT, "tags")
        tags = [validate_tag(tag, f"tags[{i}]") for i, tag in enumerate(tags)]

    top_k = validate_positive_int(top_k, "top_k", min_value=1, max_value=100)

    if window_days is not None:
        window_days = validate_positive_int(
            window_days,
            "window_days",
            min_value=1,
            max_value=3650,  # Max 10 years
        )

    if min_score is not None:
        min_score = validate_score(min_score, "min_score")

    # Validate preview_length
    if preview_length is not None:
        preview_length = validate_positive_int(
            preview_length, "preview_length", min_value=0, max_value=5000
        )

    # Only validate pagination if explicitly requested
    pagination_requested = page is not None or page_size is not None

    config = get_config()

    # Use config default if preview_length not specified
    if preview_length is None:
        preview_length = config.search_default_preview_length

    now = int(time.time())

    memories = db.search_memories(
        tags=tags,
        status=MemoryStatus.ACTIVE,
        window_days=window_days,
        limit=top_k * 3,
    )

    query_embed = None
    if use_embeddings and query and config.enable_embeddings:
        query_embed = _generate_query_embedding(query)

    results: list[SearchResult] = []
    for memory in memories:
        score = calculate_score(
            use_count=memory.use_count,
            last_used=memory.last_used,
            strength=memory.strength,
            now=now,
        )

        if min_score is not None and score < min_score:
            continue

        similarity = None
        if query_embed and memory.embed:
            # Semantic similarity using embeddings
            similarity = cosine_similarity(query_embed, memory.embed)

        relevance = 1.0
        if query and not use_embeddings:
            # Fallback: Use Jaccard similarity for better semantic matching
            # This matches the sophisticated fallback in clustering.py
            text_sim = text_similarity(query, memory.content)
            # Scale to 1.0-2.0 range (0.0 similarity = 1.0 relevance, 1.0 similarity = 2.0 relevance)
            relevance = 1.0 + text_sim

        final_score = score * relevance
        if similarity is not None:
            final_score = score * similarity

        results.append(SearchResult(memory=memory, score=final_score, similarity=similarity))

    results.sort(key=lambda r: r.score, reverse=True)

    # Natural spaced repetition: blend in review candidates
    final_memories = [r.memory for r in results[:top_k]]

    if include_review_candidates and query:
        # Get all active memories for review queue
        all_active = db.search_memories(status=MemoryStatus.ACTIVE, limit=10000)

        # Get memories due for review
        review_queue = get_memories_due_for_review(all_active, min_priority=0.3, limit=20)

        # Filter review candidates for relevance to query
        relevant_reviews = []
        for mem in review_queue:
            is_relevant = False

            # Check semantic similarity if embeddings available
            if query_embed and mem.embed:
                sim = cosine_similarity(query_embed, mem.embed)
                if sim and sim > 0.6:  # Somewhat relevant
                    is_relevant = True
            # Fallback: Use Jaccard similarity for text matching
            elif query:
                text_sim = text_similarity(query, mem.content)
                if text_sim > 0.3:  # Some token overlap
                    is_relevant = True

            if is_relevant:
                relevant_reviews.append(mem)

        # Blend primary results with review candidates
        if relevant_reviews:
            final_memories = blend_search_results(
                final_memories,
                relevant_reviews,
                blend_ratio=config.review_blend_ratio,
            )

    # Convert back to SearchResult format for final output
    final_results = []
    for mem in final_memories:
        # Find the original SearchResult if it exists
        original = next((r for r in results if r.memory.id == mem.id), None)
        if original:
            final_results.append(original)
        else:
            # It's a review candidate, calculate fresh score
            score = calculate_score(
                use_count=mem.use_count,
                last_used=mem.last_used,
                strength=mem.strength,
                now=now,
            )
            final_results.append(SearchResult(memory=mem, score=score, similarity=None))

    # Apply pagination only if requested
    if pagination_requested:
        # Validate and get non-None values
        valid_page, valid_page_size = validate_pagination_params(page, page_size)
        paginated = paginate_list(final_results, page=valid_page, page_size=valid_page_size)
        return {
            "success": True,
            "count": len(paginated.items),
            "results": [
                {
                    "id": r.memory.id,
                    "content": _truncate_content(r.memory.content, preview_length),
                    "tags": r.memory.meta.tags,
                    "score": round(r.score, 4),
                    "similarity": round(r.similarity, 4) if r.similarity else None,
                    "use_count": r.memory.use_count,
                    "last_used": r.memory.last_used,
                    "age_days": round((now - r.memory.created_at) / 86400, 1),
                    "review_priority": round(r.memory.review_priority, 4)
                    if r.memory.review_priority > 0
                    else None,
                }
                for r in paginated.items
            ],
            "pagination": paginated.to_dict(),
        }
    else:
        # No pagination - return all results
        return {
            "success": True,
            "count": len(final_results),
            "results": [
                {
                    "id": r.memory.id,
                    "content": _truncate_content(r.memory.content, preview_length),
                    "tags": r.memory.meta.tags,
                    "score": round(r.score, 4),
                    "similarity": round(r.similarity, 4) if r.similarity else None,
                    "use_count": r.memory.use_count,
                    "last_used": r.memory.last_used,
                    "age_days": round((now - r.memory.created_at) / 86400, 1),
                    "review_priority": round(r.memory.review_priority, 4)
                    if r.memory.review_priority > 0
                    else None,
                }
                for r in final_results
            ],
        }

Mnemex

search_memory

Instructions

Input Schema

Implementation Reference

Other Tools

Latest Blog Posts

MCP directory API