MCP ウェブサイト ダウンローダー
ドキュメント Web サイトをダウンロードし、RAG インデックス作成用に準備するためのシンプルな MCP サーバー。
特徴
完全なドキュメント サイトをダウンロードします (とにかく大きな塊です)。
リンク構造とナビゲーションは維持されますが、実際はそうではありません。笑
アセット (CSS、JS、画像) をダウンロードして整理しますが、実際には AI フレンドリーではないため、おそらくすべてを何らかの解析またはベクトル化して DB などに格納する必要があります。
RAG システムのクリーンなインデックスを作成します。現在は各フォルダーにインデックスを作成しているようですが、確認もされていません。
シンプルな単一目的の MCP インターフェースです。
インストール
フォークしてダウンロードし、リポジトリに cd します。
独自のパスを使用して、これを claude_desktop_config.json に追加します。

心配する必要のない他の使用法は、幻覚的である可能性があります(笑)
サーバーを起動します。
Claude Desktop またはその他の MCP クライアントを通じて使用:
出力構造
発達
サーバーは標準の MCP アーキテクチャに従います。
コンポーネント
server.py: ツールの登録とリクエストを処理するメインの MCP サーバー実装core.py: 適切なアセット処理を備えたコアウェブサイトダウンロード機能utils.py: ファイル処理と URL 処理のためのヘルパーユーティリティ
設計原則
単一責任
各モジュールには明確な目的がある
サーバーはMCPインターフェースを処理する
コアはダウンロードを処理する
Utilsは一般的な操作を処理します
クリーンな構造
元のサイト構造を維持
資産を種類別に整理する
RAGシステムの明確なインデックスを作成します
堅牢な操作
適切なエラー処理
適切な水深制限
アセットダウンロードの検証
クリーンなURL/パス処理
RAGインデックス
rag_index.jsonファイルには次の内容が含まれます。
貢献
リポジトリをフォークする
機能ブランチを作成する
変更を加える
プルリクエストを送信する
ライセンス
MITライセンス - LICENSEファイルを参照
エラー処理
サーバーは一般的な問題を処理します:
無効なURL
ネットワークエラー
アセットのダウンロード失敗
不正なHTML
深い再帰
ファイルシステムエラー
エラー応答は次の形式に従います。
成功応答:
local-only server
The server can only run on the client's local machine because it depends on local resources.
Tools
このサーバーにより、ユーザーは Web サイト全体とその資産をオフライン アクセス用にダウンロードすることができ、構成可能な深度と同時実行の設定がサポートされます。
Related Resources
Related MCP Servers
- Asecurity-licenseAqualityThis server enables LLMs to retrieve and process content from web pages, converting HTML to markdown for easier consumption.Last updated -171,513MIT License
- Asecurity-licenseAqualityProvides a tool to download entire websites using wget. It preserves the website structure and converts links to work locally.Last updated -1138
- Asecurity-licenseAqualityAn advanced web browsing server enabling headless browser interactions via a secure API, providing features like navigation, content extraction, element interaction, and screenshot capture.Last updated -623MIT License
- -security-license-qualityThis server provides an interface for performing basic file system operations such as navigation, reading, writing, and file analysis, allowing users to manage directories and files efficiently.Last updated -4