Semantic Search MCP
Semantic Search
Markdownファイルに対するセマンティック検索。キーワードだけでなく、意味に基づいて関連するノートを見つけます。新しいノートを作成する前に重複を検出します。
2つのサーバーモードをサポートしています:
MCPモード — Claude Code統合用
RESTモード — OpenClaw、スクリプト、HTTPクライアント用
機能
sentence-transformersを使用したセマンティック検索
重複/類似ノートの検出
ファイル監視によるインデックスの自動更新
マルチディレクトリ対応
インラインタグ抽出 (
#tag-name)
インストール
CPUのみ(推奨 — 約5GB節約、一般的なボルトサイズではパフォーマンスは同等):
uv tool install --index https://download.pytorch.org/whl/cpu \
git+https://github.com/bborbe/semantic-searchCUDAを使用する場合(専用GPUがある場合のみ):
uv tool install git+https://github.com/bborbe/semantic-searchアップグレード
uv tool upgrade semantic-searchサーバーモード
MCPモード (Claude Code用)
claude mcp add -s project semantic-search \
--env CONTENT_PATH=/path/to/vault \
-- \
uvx --from git+https://github.com/bborbe/semantic-search semantic-search-mcp serve利用可能なツール:
search_related(query, top_k=5)— 意味的に関連するノートを検索check_duplicates(file_path)— 重複/類似ノートを検出
RESTモード (OpenClaw/HTTP用)
CONTENT_PATH=/path/to/vault semantic-search-mcp serve --mode rest --port 8321エンドポイント:
エンドポイント | メソッド | 説明 |
| GET | セマンティック検索 |
| GET | 重複ノートの検索 |
| GET | インデックス統計を含むヘルスチェック |
| GET/POST | インデックスの強制再構築 |
クエリ例:
# Search
curl 'http://localhost:8321/search?q=kubernetes+deployment'
# Find duplicates
curl 'http://localhost:8321/duplicates?file=notes/my-note.md'
# Health check
curl 'http://localhost:8321/health'CLIコマンド
サーバーを起動せずに実行するワンショットコマンド:
# Search
CONTENT_PATH=/path/to/vault semantic-search search "kubernetes deployment"
# Find duplicates
CONTENT_PATH=/path/to/vault semantic-search duplicates path/to/note.md2つのバイナリ
バイナリ | 目的 |
| サーバーモード — |
| CLIのみ — |
設定
環境変数
変数 | 説明 | デフォルト |
| インデックス対象ディレクトリ(複数指定はカンマ区切り) |
|
| ログレベル (DEBUG, INFO, WARNING, ERROR) |
|
複数ディレクトリ
パスをカンマで区切ることで、複数のディレクトリをインデックス化できます:
CONTENT_PATH=/path/to/vault1,/path/to/vault2,/path/to/docsすべてのディレクトリはまとめてインデックス化され、1つの統合されたインデックスとして検索されます。
仕組み
初回実行時に小さな埋め込みモデル(約90MB)をダウンロードし、Markdownファイルをインデックス化します(一般的なボルトであれば1秒未満)。インデックスはファイルシステム監視を通じてファイルが変更されると自動的に更新されます。
インデックス化されるコンテンツ
各Markdownファイルは、重み付けされたコンポーネントでインデックス化されます:
コンポーネント | 重み | メモ |
ファイル名 | 3x | |
Frontmatter | 3x | |
Frontmatter | 2x | インラインタグとマージ |
Frontmatter | 2x | |
インラインタグ ( | 2x | 本文から抽出 |
最初のH1見出し | 2x | |
本文コンテンツ | 1x | 最初の500単語 |
開発
# Clone
git clone https://github.com/bborbe/semantic-search
cd semantic-search
# Install dev dependencies
make install
# Run checks
make check
# Run tests
make testライセンス
BSD 2-Clause License — LICENSE を参照してください。
This server cannot be installed
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Appeared in Searches
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/bborbe/semantic-search-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server