🐝 Swarms MCP ドキュメントサーバー
📖 説明
このプログラムは、 FastMCPを基盤とするエージェントフレームワーク・ドキュメンテーション MCP サーバーであり、 AI エージェントがドキュメントデータベースから効率的に情報を取得できるように設計されています。ハイブリッドなセマンティック(ベクター)検索とキーワード(BM25)検索、チャンクインデックス、そして堅牢な FastMCP ツール API を組み合わせることで、シームレスなエージェント統合を実現します。
主な機能:
- セマンティック検索とキーワード検索の両方を使用した効率的なチャンクレベルの検索
- エージェントはFastMCPツールを使用してドキュメントを照会、リスト、取得できます。
- ローカルファースト、低レイテンシ設計(すべてのデータはローカルでインデックス化され、クエリされる)
- ファイル変更時の自動再インデックス
- モジュール式:
corpora/
に任意のリポジトリを追加し、すべての主要なファイルタイプをサポートします - 拡張可能: 必要に応じて新しいツール、リトリーバー、またはコーパスを追加できます
メインモジュール:
embed_documents.py
→ ドキュメントを読み込み、チャンク化し、埋め込みますswarms_server.py
→ MCPサーバーとFastMCPツールを起動します
🌟 主な機能
- ハイブリッド リトリーバー🔍: セマンティック検索とキーワード検索を組み合わせます。
- 動的な Markdown 処理📄: ファイル サイズに基づいたスマート ローダー。
- 特殊なローダー⚙️:
.py
、.ipynb
、.md
、.txt
、.yaml
、.yml
。 - チャンクとファイルの概要📈: チャンク数とファイル数を表示します。
- ライブウォッチドッグ🔥:
corpora/
内のあらゆる変更に即座に応答します。 - コストに関するユーザー確認✅: 高価な埋め込みの前に確認します。
- ヘルスチェックエンドポイント🚑: サーバーが使用可能であることを確認します。
- ローカルファースト🗂️: すべてのリポジトリは外部依存関係なしでローカルにインデックス付けされます。
- 安全な削除ヘルパー🔥: 壊れた/不一致のインデックスを自動削除します。
🏗️ バージョン履歴
バージョン | 日付 | ハイライト |
---|---|---|
2.2 | 2025年4月25日 | サーバーからの埋め込み/読み込みを分割し、読み込みサマリーでチャンク全体をカウントします。 |
1.0 | 2025年4月25日 | ダイナミックマークダウンローダー、カラーログ、ヘルスチェックツール |
0.7 | 2025年4月25日 | .py 、 .ipynb 、 .md 用の特殊なファイルローダー |
0.5 | 2025年4月10日 | OpenAIの大規模モデル埋め込み、拡張MCPツール |
0.1 | 2025年4月10日 | 汎用ローダー付きの初期バージョン |
📚 コーパスの管理(ローカルリポジトリ)
Swarms やその他のフレームワークは非常に大きいため、完全なコーパスは GitHub にプッシュされません。
代わりに、 corpora/
の下に手動でクローンを作成します。
✅注記:
- パブリック、プライベート、カスタムなど、任意のリポジトリを追加します。
- 独自のカスタム AI ナレッジ ベースをローカルに構築します。
- 大きなリポジトリ(>500 MB) でも問題ありません。すべてのインデックスはローカルで行われます。
🚀 クイックスタート
⚙️ 構成
- コーパス:
corpora/
- 環境変数:
.env
にはOPENAI_API_KEY
が含まれている必要があります
- インデックスファイルのサポート:
chroma-collections.parquet
とchroma.sqlite3
の両方がサポートされています。両方存在する場合は.parquet
が優先されます。
- 自動埋め込み:
- インデックスが見つからない場合、サーバーはドキュメントを自動的に埋め込み、インデックスを作成す��ように要求します。
- オプション:
- 必要に応じて、Chroma 圧縮を無効にします。
- 必要に応じて、Chroma 圧縮を無効にします。
- コマンドラインフラグ:
--reindex
→ サーバー実行中に更新再インデックスをトリガーします。
🔄 ファイル監視と自動再インデックス
MCP サーバーは、 corpora/
ファイルの変更を監視します。
- 変更、作成、または削除が行われると、ライブ再インデックスがトリガーされます。
- サーバーを再起動する必要はありません。
🛠️ 利用可能なFastMCPツール
道具 | 説明 |
---|---|
swarm_docs.search | 関連するドキュメントチャンクを検索 |
swarm_docs.list_files | インデックスされたすべてのファイルを一覧表示する |
swarm_docs.get_chunk | パスとインデックスで特定のチャンクを取得する |
swarm_docs.reindex | 強制的に再インデックス(完全または増分) |
swarm_docs.healthcheck | MCPサーバーのステータスを確認する |
❓ トラブルシューティング
- Q: サーバーの起動時に「有効な既存のインデックスが見つかりません」というメッセージが表示されます。
- A: サーバーからドキュメントの埋め込みとインデックス作成を促すメッセージが表示されます。プロンプトに従って続行するか、
python embed_documents.py
手動で実行してください。
- A: サーバーからドキュメントの埋め込みとインデックス作成を促すメッセージが表示されます。プロンプトに従って続行するか、
- Q: どのインデックス ファイルが使用されますか?
- A: サーバーは、利用可能な場合は
chroma-collections.parquet
を使用し、そうでない場合はchroma.sqlite3
使用します。
- A: サーバーは、利用可能な場合は
- Q: 強制的に再インデックスを実行したいです。
- A:
python swarms_server.py --reindex
実行するか、swarm_docs.reindex
ツールを使用します。
- A:
📋 使用例
🧰 拡張と再構築
- 新しいドキュメントを追加→
corpora/
にドロップして、次の操作を実行します。 - スキーマの変更→ (例: メタデータ構造の違い):
- 新しいリポジトリを追加→
corpora/
下にフォルダーをドロップし、インデックスを再作成します。 - 主に読み取り専用のリポジトリに推奨:
🔗 IDE統合
Windsurf Cascade に直接接続します。
その後、Cascade 自動化からswarm_docs.*
ツールにアクセスできるようになります。
📦 要件
💡 Python 3.11 環境が必要です
環境を明示的に作成します。
次に次のコマンドでインストールします:
✅ MCP サーバー対応
起動後:
- 適切な読み込みサマリー
- 高価なアクションの前に安全を確認する
- 自動ファイル監視と再インデックス
- ウィンドサーフィンプラグイン対応
- 完全なツールカバレッジ
カスケードしても大丈夫です! 🏄♂️
📈 フロー図
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
エージェント フレームワーク ドキュメント サーバーは、AI エージェントがハイブリッド セマンティック検索とキーワード検索を使用してドキュメント データベースから情報を効率的に取得し、シームレスなエージェント統合を実現します。
Related MCP Servers
- AsecurityAlicenseAqualityAn MCP server implementation that provides tools for retrieving and processing documentation through vector search, enabling AI assistants to augment their responses with relevant documentation contextLast updated -76281TypeScriptMIT License
- -securityFlicense-qualityA Model Context Protocol server utilizing Claude AI for generating intelligent queries and offering documentation assistance based on API documentation analysis.Last updated -32TypeScript
- -securityFlicense-qualityEnables AI assistants to enhance their responses with relevant documentation through a semantic vector search, offering tools for managing and processing documentation efficiently.Last updated -6213TypeScript
- -securityFlicense-qualityA smart documentation server that provides AI-assisted code improvement and documentation management through Claude Desktop integration.Last updated -7TypeScript