Semantic Search MCP
Semantische Suche
Semantische Suche über Markdown-Dateien. Finden Sie verwandte Notizen nach Bedeutung, nicht nur nach Schlüsselwörtern. Erkennen Sie Duplikate, bevor Sie neue Notizen erstellen.
Unterstützt zwei Server-Modi:
MCP-Modus — Für die Integration in Claude Code
REST-Modus — Für OpenClaw, Skripte und HTTP-Clients
Funktionen
Semantische Suche mittels sentence-transformers
Erkennung von doppelten/ähnlichen Notizen
Automatische Aktualisierung des Index durch Dateiüberwachung
Unterstützung für mehrere Verzeichnisse
Extraktion von Inline-Tags (
#tag-name)
Installation
Nur CPU (empfohlen — spart ca. 5 GB, identische Leistung bei typischen Vault-Größen):
uv tool install --index https://download.pytorch.org/whl/cpu \
git+https://github.com/bborbe/semantic-searchMit CUDA (nur wenn Sie eine dedizierte GPU haben):
uv tool install git+https://github.com/bborbe/semantic-searchUpgrade
uv tool upgrade semantic-searchServer-Modi
MCP-Modus (für Claude Code)
claude mcp add -s project semantic-search \
--env CONTENT_PATH=/path/to/vault \
-- \
uvx --from git+https://github.com/bborbe/semantic-search semantic-search-mcp serveVerfügbare Tools:
search_related(query, top_k=5)— Findet semantisch verwandte Notizencheck_duplicates(file_path)— Erkennt doppelte/ähnliche Notizen
REST-Modus (für OpenClaw/HTTP)
CONTENT_PATH=/path/to/vault semantic-search-mcp serve --mode rest --port 8321Endpunkte:
Endpunkt | Methode | Beschreibung |
| GET | Semantische Suche |
| GET | Findet doppelte Notizen |
| GET | Gesundheitsprüfung mit Index-Statistiken |
| GET/POST | Erzwingt den Neuaufbau des Index |
Beispielabfragen:
# Search
curl 'http://localhost:8321/search?q=kubernetes+deployment'
# Find duplicates
curl 'http://localhost:8321/duplicates?file=notes/my-note.md'
# Health check
curl 'http://localhost:8321/health'CLI-Befehle
Einmalige Befehle ohne laufenden Server:
# Search
CONTENT_PATH=/path/to/vault semantic-search search "kubernetes deployment"
# Find duplicates
CONTENT_PATH=/path/to/vault semantic-search duplicates path/to/note.mdZwei Binärdateien
Binärdatei | Zweck |
| Server-Modus — |
| Nur CLI — |
Konfiguration
Umgebungsvariablen
Variable | Beschreibung | Standard |
| Zu indizierendes Verzeichnis (durch Kommas getrennt für mehrere) |
|
| Protokollierungsebene (DEBUG, INFO, WARNING, ERROR) |
|
Mehrere Verzeichnisse
Indizieren Sie mehrere Verzeichnisse, indem Sie die Pfade durch Kommas trennen:
CONTENT_PATH=/path/to/vault1,/path/to/vault2,/path/to/docsAlle Verzeichnisse werden zusammen indiziert und als ein einheitlicher Index durchsucht.
Funktionsweise
Der erste Durchlauf lädt ein kleines Embedding-Modell (~90 MB) herunter und indiziert Ihre Markdown-Dateien (<1s bei typischen Vaults). Der Index aktualisiert sich automatisch, wenn Dateien über die Dateisystemüberwachung geändert werden.
Indizierter Inhalt
Jede Markdown-Datei wird mit gewichteten Komponenten indiziert:
Komponente | Gewichtung | Hinweise |
Dateiname | 3x | |
Frontmatter | 3x | |
Frontmatter | 2x | Zusammengeführt mit Inline-Tags |
Frontmatter | 2x | |
Inline-Tags ( | 2x | Aus dem Text extrahiert |
Erste H1-Überschrift | 2x | |
Hauptinhalt | 1x | Erste 500 Wörter |
Entwicklung
# Clone
git clone https://github.com/bborbe/semantic-search
cd semantic-search
# Install dev dependencies
make install
# Run checks
make check
# Run tests
make testLizenz
BSD 2-Clause License — siehe LICENSE.
This server cannot be installed
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Appeared in Searches
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/bborbe/semantic-search-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server