Skip to main content
Glama
bborbe

Semantic Search MCP

by bborbe

Semantische Suche

Semantische Suche über Markdown-Dateien. Finden Sie verwandte Notizen nach Bedeutung, nicht nur nach Schlüsselwörtern. Erkennen Sie Duplikate, bevor Sie neue Notizen erstellen.

Unterstützt zwei Server-Modi:

  • MCP-Modus — Für die Integration in Claude Code

  • REST-Modus — Für OpenClaw, Skripte und HTTP-Clients

Funktionen

  • Semantische Suche mittels sentence-transformers

  • Erkennung von doppelten/ähnlichen Notizen

  • Automatische Aktualisierung des Index durch Dateiüberwachung

  • Unterstützung für mehrere Verzeichnisse

  • Extraktion von Inline-Tags (#tag-name)

Installation

Nur CPU (empfohlen — spart ca. 5 GB, identische Leistung bei typischen Vault-Größen):

uv tool install --index https://download.pytorch.org/whl/cpu \
  git+https://github.com/bborbe/semantic-search

Mit CUDA (nur wenn Sie eine dedizierte GPU haben):

uv tool install git+https://github.com/bborbe/semantic-search

Upgrade

uv tool upgrade semantic-search

Server-Modi

MCP-Modus (für Claude Code)

claude mcp add -s project semantic-search \
  --env CONTENT_PATH=/path/to/vault \
  -- \
  uvx --from git+https://github.com/bborbe/semantic-search semantic-search-mcp serve

Verfügbare Tools:

  • search_related(query, top_k=5) — Findet semantisch verwandte Notizen

  • check_duplicates(file_path) — Erkennt doppelte/ähnliche Notizen

REST-Modus (für OpenClaw/HTTP)

CONTENT_PATH=/path/to/vault semantic-search-mcp serve --mode rest --port 8321

Endpunkte:

Endpunkt

Methode

Beschreibung

/search?q=...&top_k=5

GET

Semantische Suche

/duplicates?file=...&threshold=0.85

GET

Findet doppelte Notizen

/health

GET

Gesundheitsprüfung mit Index-Statistiken

/reindex

GET/POST

Erzwingt den Neuaufbau des Index

Beispielabfragen:

# Search
curl 'http://localhost:8321/search?q=kubernetes+deployment'

# Find duplicates
curl 'http://localhost:8321/duplicates?file=notes/my-note.md'

# Health check
curl 'http://localhost:8321/health'

CLI-Befehle

Einmalige Befehle ohne laufenden Server:

# Search
CONTENT_PATH=/path/to/vault semantic-search search "kubernetes deployment"

# Find duplicates
CONTENT_PATH=/path/to/vault semantic-search duplicates path/to/note.md

Zwei Binärdateien

Binärdatei

Zweck

semantic-search-mcp

Server-Modus — serve (MCP oder REST), plus search und duplicates

semantic-search

Nur CLI — search und duplicates als Einmalbefehle, kein serve

Konfiguration

Umgebungsvariablen

Variable

Beschreibung

Standard

CONTENT_PATH

Zu indizierendes Verzeichnis (durch Kommas getrennt für mehrere)

./content

LOG_LEVEL

Protokollierungsebene (DEBUG, INFO, WARNING, ERROR)

INFO

Mehrere Verzeichnisse

Indizieren Sie mehrere Verzeichnisse, indem Sie die Pfade durch Kommas trennen:

CONTENT_PATH=/path/to/vault1,/path/to/vault2,/path/to/docs

Alle Verzeichnisse werden zusammen indiziert und als ein einheitlicher Index durchsucht.

Funktionsweise

Der erste Durchlauf lädt ein kleines Embedding-Modell (~90 MB) herunter und indiziert Ihre Markdown-Dateien (<1s bei typischen Vaults). Der Index aktualisiert sich automatisch, wenn Dateien über die Dateisystemüberwachung geändert werden.

Indizierter Inhalt

Jede Markdown-Datei wird mit gewichteten Komponenten indiziert:

Komponente

Gewichtung

Hinweise

Dateiname

3x

Frontmatter title

3x

Frontmatter tags

2x

Zusammengeführt mit Inline-Tags

Frontmatter aliases

2x

Inline-Tags (#tag)

2x

Aus dem Text extrahiert

Erste H1-Überschrift

2x

Hauptinhalt

1x

Erste 500 Wörter

Entwicklung

# Clone
git clone https://github.com/bborbe/semantic-search
cd semantic-search

# Install dev dependencies
make install

# Run checks
make check

# Run tests
make test

Lizenz

BSD 2-Clause License — siehe LICENSE.

-
security - not tested
A
license - permissive license
-
quality - not tested

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Appeared in Searches

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/bborbe/semantic-search-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server