What can you do with this server?

This server provides long-term semantic memory for AI assistants using a hybrid knowledge base with vector and lexical search capabilities. * Save notes (save_note): Ingest notes (Markdown or HTML) with automatic YAML metadata extraction, semantic chunking, vector embedding generation via Ollama, deduplication, and atomic persistence to SQLite. * Search the wiki (search_wiki): Perform hybrid semantic and lexical search using vector KNN (sqlite-vec) and FTS5, fused with Reciprocal Rank Fusion (RRF). Falls back gracefully to lexical-only search if Ollama is unavailable. Supports filtering by project. * List notes (list_notes): Browse stored notes with optional filtering by project ID or global scope. * Check ingestion status (get_ingestion_status): Audit knowledge base health by retrieving notes that failed or were skipped during ingestion (e.g., due to Ollama timeouts). * Ensure data integrity: A built-in linter audits knowledge structure, enforces syntax rules (balanced tags, valid links), and triggers automatic synchronizations. * Isolate and share knowledge: Manage knowledge within isolated projects while inheriting global, transversal knowledge across projects.

How do I use LLM Wiki MCP Server?

1. Click on "Install Server". 2. Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state. 3. In the chat, type @ followed by the MCP server name and your instructions, e.g., "@LLM Wiki MCP Server save this meeting summary about Q3 planning" That's it! The server will respond to your query, and you can continue using it as needed. Here is a step-by-step guide with screenshots.

LLM Wiki MCP Server

by Delagund

Overview Schema Related Servers Score Discussions

Python

Local

LLM Wiki MCP Server

Un Servidor MCP (Model Context Protocol) diseñado para dotar a Asistentes de IA de Memoria Semántica de Largo Plazo utilizando una base de conocimientos híbrida (Markdown estilo Obsidian + HTML Estructurado Minimalista) bajo los principios del estándar OKF (Open Knowledge Format) y una arquitectura de recuperación (RAG) Híbrida.

🚀 Características Principales y Enfoque OKF

Este servidor de memoria semántica ha evolucionado para alinearse con los principios de interoperabilidad y estructuración formal del conocimiento.

Búsqueda Híbrida (Vectorial + Léxica): Realiza búsquedas vectoriales avanzadas con KNN a través de sqlite-vec y modelos locales (Ollama), con una degradación elegante (fallback) hacia Full-Text Search (FTS5) en caso de fallas o timeouts de Ollama.
Soporte Híbrido Markdown + HTML Semántico: Además de notas clásicas en Markdown, el sistema es compatible con notas escritas en HTML Puro y Minimalista.
Enfoque OKF (Open Knowledge Format): Las notas estructuradas permiten mapear relaciones y clasificar el conocimiento mediante etiquetas y propiedades semánticas tipadas, optimizando el consumo de tokens y la consistencia.
Syntax-Aware Chunking: Almacena notas fragmentadas (~2000 caracteres) respetando la sintaxis del lenguaje, evitando truncar bloques lógicos de código Markdown o etiquetas de bloque HTML, y favoreciendo un overlap controlado (200 caracteres).
Control de Idempotencia Estricto: Evita indexar el mismo contenido varias veces usando un hash por fragmento, solucionando las brechas fantasmas y la degradación del rendimiento por acumulación excesiva de información duplicada.
Aislamiento de Proyectos: Búsqueda contextualmente aislada pero con capacidad de heredar "Conocimiento Global" transversal a múltiples repositorios.
Linter de Integridad Cero-Latencia: Linter nativo 100% Python (tools/lint.py) que audita reglas restrictivas sobre la estructura de la wiki (etiquetas balanceadas, enlaces tipados, etc.) y levanta auto-sincronizaciones en el propio servidor MCP (--ingest) de inmediato tras detectar cambios.

Related MCP server: Memory MCP

💡 Ventajas del Enfoque HTML Minimalista (OKF-Aligned)

El uso de HTML minimalista (cero CSS, sin clases ni estilos inline) presenta múltiples ventajas críticas para el procesamiento por parte de modelos de lenguaje en comparación con el Markdown plano:

Estructura Semántica de Alta Precisión: El uso de etiquetas de bloque <section id="..."> y <article> permite realizar lecturas selectivas. Un agente puede recuperar secciones específicas mediante su ID (scoping_id), reduciendo significativamente la ventana de contexto y el consumo de tokens.
Enlaces con Semántica Explícita: Los hipervínculos estructurados <a href="nota.html" rel="dependency"> definen explícitamente el tipo de conexión entre entidades (ej. relaciones tipadas como dependency, concept-link, source-summary, comparison), facilitando la construcción y recorrido automatizado del grafo de conocimiento.
Validación Rigurosa y Estricta: Las reglas de la sintaxis HTML permiten al linter (tools/lint.py) verificar en tiempo de compilación y disco que no existan etiquetas mal cerradas, que los enlaces sean válidos y que no se usen atributos prohibidos (class o style que añaden ruido de tokens innecesarios).
Metadatos Ultraligeros: El Frontmatter YAML de las notas HTML se define de manera compacta dentro de comentarios HTML (), manteniendo la interoperabilidad y legibilidad de metadatos tipo OKF.

📈 Estado Actual del Proyecto (Hitos de Desarrollo)

El proyecto ha completado de forma exitosa sus 7 Fases del Plan de Trabajo Escalonado:

Fase 1: Motor SQLite & RAG Híbrido: Persistencia en SQLite, embeddings a través de Ollama (nomic-embed-text) y búsqueda híbrida KNN/FTS5 con fallback automático.
Fase 2: Estrategia de Chunking Sintáctico: Segmentación inteligente de archivos basada en semántica y sintaxis Markdown.
Fase 3: Idempotencia de Datos: Deduplicación física mediante hashing a nivel de fragmentos.
Fase 4: Soporte de Notas Híbridas (HTML): Ingestión completa de HTML minimalista compatible con linter local.
Fase 5: Linter de Integridad & Grafo: Implementación de tools/lint.py para control estricto de rutas de archivos, kebab-case, etiquetas balanceadas, enlaces en cascada y referencias circulares.
Fase 6: Mecánica de Ingesta Asíncrona (Lazy Sync): Detección en segundo plano de cambios en archivos durante el arranque (startup_lazy_check) para evitar bloqueos en el hilo principal del servidor MCP.
Fase 7: Directrices de Skill de Agente: Configuración de instrucciones arquitectónicas integradas en .agents/skills/manage-memory/SKILL.md para guiar de manera autónoma a los agentes en el uso del grafo híbrido y sus convenciones.

📂 Estructura del Repositorio

server.py: Servidor primario FastMCP. Contiene las herramientas expuestas a los agentes (save_note, search_wiki, list_notes, get_ingestion_status).
database.py: Esquema de persistencia con transacciones SQLite, vec0 y fts5.
ollama_integration.py: Cliente y adaptador de embeddings para Ollama con thresholds estrictos de timeout.
tools/lint.py: Herramienta de chequeo de integridad que mantiene el conocimiento sano y dispara actualizaciones al vuelo.
wiki/: Base de conocimientos final estructurada en notas formato Markdown o HTML e indexada por el servidor.
sources/: Recursos originales en estado crudo (ej. archivos PDF o código fuente nativo) referenciados desde la Wiki.

🛠 Instalación y Configuración

El proyecto está diseñado para funcionar como un servidor MCP de memoria semántica. Para simplificar su registro y configuración en los distintos clientes, se proporciona un asistente interactivo:

# Ejecutar el asistente de instalación interactivo
python tools/install_mcp.py

Este script automatiza el flujo completo de instalación:

Detecta si Ollama está activo en el puerto 11434 y si posee el modelo nomic-embed-text.
Solicita interactivamente la ruta para el directorio base de conocimientos (LLM_WIKI_DIR).
Resuelve las rutas absolutas del entorno virtual .venv y de server.py.
Escribe/actualiza la configuración de llm-wiki-memory en Claude Desktop, Claude Code y Google Antigravity.
Genera la configuración stdio basada en uvx para otros clientes.

1. Parámetros y Variables de Entorno

El servidor requiere o soporta las siguientes variables de entorno en su ejecución:

LLM_WIKI_DIR: (Obligatorio si no existe archivo de configuración local) Ruta absoluta al directorio raíz del conocimiento. El servidor asumirá que las notas residen en wiki/ y los recursos en sources/ dentro de este directorio base, además de ubicar en él la base de datos SQLite wiki.db.
MCP_PROJECT_ID: Identificador del proyecto activo para aislar el contexto de las notas y evitar mezclar bases de conocimientos de proyectos distintos. Por defecto se utiliza llm_wiki o el nombre de la carpeta contenedora si no se especifica.
OLLAMA_EMBED_MODEL: Modelo de embedding a utilizar. Por defecto se usa nomic-embed-text.
OLLAMA_EMBED_DIMS: Dimensión de los embeddings generados por el modelo (por defecto 768 para nomic-embed-text).

⚠️ Atención sobre los Embeddings: Si decides cambiar el modelo vectorial (por ejemplo, a mxbai-embed-large de 1024 dimensiones), DEBES borrar físicamente la base de datos (rm ~/.config/mcp-wiki/mcp-wiki.db) antes de arrancar. sqlite-vec construye su esquema basándose en esa dimensión y arrojará un error si intentas mezclar vectores de distintos tamaños.

2. Configuración Manual por Cliente

Si prefieres registrar el servidor manualmente, a continuación se detallan los bloques de configuración para cada cliente compatible utilizando la ruta genérica de ejemplo /Users/tu_usuario/Cerebro.

A. Google Antigravity

Google Antigravity soporta configuraciones de servidores MCP tanto a nivel global como a nivel de proyecto (local):

Configuración Global (~/.gemini/config/mcp_config.json):

{
  "mcpServers": {
    "llm-wiki-memory": {
      "command": "/Users/tu_usuario/llm_wiki/.venv/bin/python",
      "args": ["/Users/tu_usuario/llm_wiki/server.py"],
      "env": {
        "LLM_WIKI_DIR": "/Users/tu_usuario/Cerebro",
        "MCP_PROJECT_ID": "llm_wiki"
      }
    }
  }
}

Configuración Local (.agents/mcp_config.json): Ubica el mismo bloque JSON en un archivo llamado mcp_config.json dentro de la carpeta .agents/ en la raíz del proyecto para habilitar el servidor únicamente dentro de este espacio de trabajo.

B. Claude Desktop

Para el cliente de escritorio oficial de Claude, agrega el servidor en ~/Library/Application Support/Claude/claude_desktop_config.json:

{
  "mcpServers": {
    "llm-wiki-memory": {
      "command": "/Users/tu_usuario/llm_wiki/.venv/bin/python",
      "args": ["/Users/tu_usuario/llm_wiki/server.py"],
      "env": {
        "LLM_WIKI_DIR": "/Users/tu_usuario/Cerebro",
        "MCP_PROJECT_ID": "llm_wiki"
      }
    }
  }
}

C. Claude Code

La CLI de Claude Code almacena sus configuraciones en ~/.claude.json. Para configurar este servidor MCP de memoria semántica específicamente bajo el espacio de trabajo de este proyecto, agrégalo bajo el bloque de "projects":

{
  "projects": {
    "/Users/tu_usuario/llm_wiki": {
      "mcpServers": {
        "llm-wiki-memory": {
          "command": "/Users/tu_usuario/llm_wiki/.venv/bin/python",
          "args": ["/Users/tu_usuario/llm_wiki/server.py"],
          "env": {
            "LLM_WIKI_DIR": "/Users/tu_usuario/Cerebro",
            "MCP_PROJECT_ID": "llm_wiki"
          }
        }
      }
    }
  }
}

D. Clientes IDE STDIO Estándar (Cursor, Roo-Code, Cline) vía `uvx`

Si deseas usar este MCP en clientes stdio sin instalar dependencias globales o locales fijas, puedes consumirlo a través de uvx configurando el cliente del IDE de la siguiente manera:

{
  "mcpServers": {
    "llm-wiki-memory": {
      "command": "uvx",
      "args": ["--from", "/Users/tu_usuario/llm_wiki", "llm-wiki-mcp"],
      "env": {
        "LLM_WIKI_DIR": "/Users/tu_usuario/Cerebro",
        "MCP_PROJECT_ID": "llm_wiki"
      }
    }
  }
}

⚠️ Atención sobre los Embeddings: Si decides cambiar el modelo vectorial (por ejemplo, a mxbai-embed-large de 1024 dimensiones), DEBES borrar físicamente la base de datos (rm ~/.config/mcp-wiki/mcp-wiki.db) antes de arrancar. sqlite-vec construye su esquema basándose en esa dimensión y arrojará un error si intentas mezclar vectores de distintos tamaños.

🤖 Configuración para Agentes (SKILL.md)

Para que cualquier modelo de lenguaje o agente IA (Cursor, Claude Code) entienda perfectamente los protocolos y flujos del servidor MCP sin intervención manual, debes indicarle que cree su propia habilidad o Skill.

Instrucción requerida para el agente:

"Por favor, crea un archivo en .agents/skills/manage-memory/SKILL.md con el siguiente contenido exacto para gestionar tu forma de procesar la memoria en este proyecto:"

---
name: manage-memory
description: Instrucciones arquitectónicas sobre cómo guardar, procesar o buscar conocimientos, PDFs, y reflexiones dentro del ecosistema LLM-Wiki MCP. Usa este skill cuando el usuario pida "memorizar", "guardar" o procesar nueva información.
---

# Flujo de Operación de la Memoria Semántica (LLM Wiki)

Actúas en un entorno respaldado por un servidor MCP de memoria semántica. Tu responsabilidad es procesar información cruda y transformarla en notas altamente estructuradas. NO debes indexar vectores manualmente, el servidor MCP (`server.py`) hace esto automáticamente cuando usas las herramientas adecuadas.

## Escenario 0: Inicialización
Si el servidor no está inicializado o falla la carga, debes usar `initialize_project(base_path)` para configurarlo adecuadamente antes de continuar con cualquier operación.

## Formato Híbrido y Metadatos YAML
Debes priorizar la creación de archivos `.html` minimalistas (sin CSS, atributos `style` ni `class`). Los archivos Markdown (`.md`) quedan restringidos únicamente para contenido legacy.
Dentro de cada archivo `.html`, DEBES incluir un bloque de metadatos YAML usando comentarios HTML estandarizados.

El único campo obligatorio es `type`:
```html
<!--yaml
type: concept
-->

Si el archivo representa una fuente original, el formato es:

<!--yaml
type: source-summary
is_global: true
-->

Taxonomía de Nodos y Directorios

Según el type definido, el archivo debe guardarse en su directorio correspondiente. Si los directorios no existen, debes crearlos:

type: concept -> wiki/concepts/[nombre].html
type: entity -> wiki/entities/[nombre].html
type: source-summary -> wiki/sources/[nombre].html
type: comparison -> wiki/comparisons/[nombre].html

Enlaces (Grafo de Conocimiento)

Para establecer relaciones entre nodos, debes utilizar etiquetas de anclaje estándar <a href="ruta/al/archivo.ext" rel="...">:

El atributo href debe apuntar a la ruta correcta con la extensión exacta (.html o .md) para evitar roturas.
El atributo rel debe definir el tipo de relación y utilizar uno de los siguientes valores: dependency, concept-link, source-summary o comparison.

Scoping y Estructuración de Contenido

Usa las etiquetas semánticas <article> y <section id="..."> para estructurar la información. Al utilizar la herramienta search_wiki, puedes (y debes, cuando aplique) enviar el parámetro scoping_id para acotar la búsqueda a contextos específicos dentro del HTML.

Sincronización Asíncrona (Eventual Consistency)

Ten en cuenta que el procesamiento de la carpeta /sources y el proceso startup_lazy_check operan asincrónicamente. Como resultado, las búsquedas pueden experimentar "consistencia eventual" (la información recién agregada puede tardar un poco en aparecer). Adicionalmente, los archivos planos ubicados en sources/ generan automáticamente su representación .html en el sistema.

🔍 Auditoría y Comprobación de Integridad

El sistema provee 3 vías diferentes para comprobar la integridad de tu base de conocimientos:

1. Vía Herramientas MCP (Agentes e IA)

Llama a get_ingestion_status(status=None) para revisar notas que fallaron (ej. timeouts de Ollama) o fueron omitidas (SKIPPED).
Llama a list_notes() para asegurar qué archivos físicos están ya sincronizados en la base de datos.

2. Vía Logs del Servidor (Tracing)

El servidor mantiene un log persistente de baja cardinalidad donde registra sincronizaciones perezosas, ingestas CLI y errores de infraestructura en tiempo real en: ~/.config/mcp-wiki/mcp-wiki.log

3. Vía Base de Datos Cruda (SQLite de Bajo Nivel)

# Comprobar corrupción estructural nativa:
sqlite3 ~/.config/mcp-wiki/mcp-wiki.db "PRAGMA integrity_check;"

# Ver conteo de fragmentos y vectores procesados:
sqlite3 ~/.config/mcp-wiki/mcp-wiki.db "SELECT count(*) AS Notas FROM notes; SELECT count(*) AS Fragmentos FROM vec_chunks;"

Install Server

license - not found

quality

maintenance

How are these scores calculated?

Maintenance

–Maintainers

–Response time

–Release cycle

–Releases (12mo)

Commit activity

Resources

GitHub Repository

Need Help?

Related Servers

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Tools

Latest Blog Posts

Your AI Chatbot Just Exposed Your CEO's Salary to an Intern
By Om-Shree-0709 on July 2, 2026.
Agent Identity
MCP Security
OAuth Delegation
Why MCP Servers Need Execution Sandboxing (And Why Your Current Stack Isn't Enough)
By Om-Shree-0709 on June 30, 2026.
Agentic Ai
Prompt Injection
WebAssembly
Lightport: Open-Sourcing Glama's AI Gateway
By punkpeye on April 27, 2026.
OpenAI
open source

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/Delagund/llm_wiki'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

LLM Wiki MCP Server

🚀 Características Principales y Enfoque OKF

💡 Ventajas del Enfoque HTML Minimalista (OKF-Aligned)

📈 Estado Actual del Proyecto (Hitos de Desarrollo)

📂 Estructura del Repositorio

🛠 Instalación y Configuración

1. Parámetros y Variables de Entorno

2. Configuración Manual por Cliente

A. Google Antigravity

B. Claude Desktop

C. Claude Code

D. Clientes IDE STDIO Estándar (Cursor, Roo-Code, Cline) vía uvx

🤖 Configuración para Agentes (SKILL.md)

Taxonomía de Nodos y Directorios

Enlaces (Grafo de Conocimiento)

Scoping y Estructuración de Contenido

Sincronización Asíncrona (Eventual Consistency)

🔍 Auditoría y Comprobación de Integridad

1. Vía Herramientas MCP (Agentes e IA)

2. Vía Logs del Servidor (Tracing)

3. Vía Base de Datos Cruda (SQLite de Bajo Nivel)

Maintenance

Resources

Looking for Admin?

Tools

Latest Blog Posts

MCP directory API

D. Clientes IDE STDIO Estándar (Cursor, Roo-Code, Cline) vía `uvx`