MCP Website Downloader
Einfacher MCP-Server zum Herunterladen von Dokumentationswebsites und Vorbereiten für die RAG-Indizierung.
Merkmale
- Lädt komplette Dokumentationsseiten herunter, zumindest große Teile.
- Behält die Linkstruktur und Navigation bei, nicht wirklich. lol
- Lädt Assets (CSS, JS, Bilder) herunter und organisiert sie, ist aber nicht wirklich KI-freundlich und es muss wahrscheinlich alles irgendwie analysiert oder in eine Datenbank oder so etwas vektorisiert werden.
- Erstellt einen sauberen Index für RAG-Systeme. Derzeit scheint in jedem Ordner ein Index erstellt zu werden, ohne dass er noch einmal angeschaut wurde.
- Einfache, zweckgebundene MCP-Schnittstelle, ja.
Installation
Forken und herunterladen, mit CD zum Repository wechseln.
Fügen Sie dies mit Ihren eigenen Pfaden in Ihre claude_desktop_config.json ein:
Andere Verwendungen, über die Sie sich keine Sorgen machen müssen und die halluzinogene Wirkungen haben können, lol:
- Starten Sie den Server:
- Verwendung über Claude Desktop oder andere MCP-Clients:
Ausgabestruktur
Entwicklung
Der Server folgt der Standard-MCP-Architektur:
Komponenten
server.py
: Hauptimplementierung des MCP-Servers, die die Tool-Registrierung und -Anfragen verarbeitetcore.py
: Kernfunktion zum Herunterladen von Websites mit ordnungsgemäßer Asset-Verarbeitungutils.py
: Hilfsprogramme für die Dateiverwaltung und URL-Verarbeitung
Designprinzipien
- Einzelverantwortung
- Jedes Modul hat einen klaren Zweck
- Server verarbeitet MCP-Schnittstelle
- Der Kern übernimmt das Herunterladen
- Utils übernimmt allgemeine Operationen
- Saubere Struktur
- Behält die ursprüngliche Site-Struktur bei
- Organisiert Vermögenswerte nach Typ
- Schafft einen übersichtlichen Index für RAG-Systeme
- Robuster Betrieb
- Richtige Fehlerbehandlung
- Angemessene Tiefengrenzen
- Überprüfung des Asset-Downloads
- Saubere URL-/Pfadverarbeitung
RAG-Index
Die Datei rag_index.json
enthält:
Beitragen
- Forken Sie das Repository
- Erstellen eines Feature-Zweigs
- Nehmen Sie Ihre Änderungen vor
- Senden einer Pull-Anfrage
Lizenz
MIT-Lizenz – Siehe LICENSE-Datei
Fehlerbehandlung
Der Server behandelt allgemeine Probleme:
- Ungültige URLs
- Netzwerkfehler
- Fehler beim Herunterladen von Assets
- Fehlerhaftes HTML
- Tiefe Rekursion
- Dateisystemfehler
Fehlerantworten folgen dem Format:
Erfolgsantworten:
You must be authenticated.
local-only server
The server can only run on the client's local machine because it depends on local resources.
Tools
Dieser Server ermöglicht Benutzern das Herunterladen ganzer Websites und ihrer Assets für den Offline-Zugriff und unterstützt konfigurierbare Tiefen- und Parallelitätseinstellungen.
- Merkmale
- Installation
- Andere Verwendungen, über die Sie sich keine Sorgen machen müssen und die halluzinogene Wirkungen haben können, lol:
- Ausgabestruktur
- Entwicklung
- Beitragen
- Lizenz
- Fehlerbehandlung
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityThis server facilitates interaction with Keboola's Storage API, enabling users to browse and manage project buckets, tables, and components efficiently through Claude Desktop.Last updated -714PythonMIT License
- AsecurityAlicenseAqualityThis server facilitates interaction with cosense/Scrapbox projects, enabling users to retrieve, list, search, and create pages while supporting various query operations and secure access to private projects.Last updated -412TypeScriptMIT License
- -securityFlicense-qualityA server for downloading, processing, and managing YouTube content with features like video quality selection, format conversion, and metadata extraction.Last updated -JavaScript
- -security-license-qualityA server that enables web scraping of difficult-to-access websites affected by bot detection, captchas, or geolocation restrictions, returning results in either HTML or Markdown format.Last updated -1JavaScript