MCP Webscan Server

Schmiedeabzeichen

Ein Model Context Protocol (MCP)-Server zum Scannen und Analysieren von Webinhalten. Dieser Server bietet Tools zum Abrufen, Analysieren und Extrahieren von Informationen aus Webseiten.

Merkmale

Seitenabruf : Konvertieren Sie Webseiten zur einfachen Analyse in Markdown
Link-Extraktion : Extrahieren und analysieren Sie Links von Webseiten
Site Crawling : Websites rekursiv durchsuchen, um Inhalte zu entdecken
Linkprüfung : Identifizieren Sie defekte Links auf Webseiten
Mustervergleich : Finden Sie URLs, die bestimmten Mustern entsprechen
Sitemap-Generierung : Generieren Sie XML-Sitemaps für Websites

Installation

Installation über Smithery

So installieren Sie Webscan für Claude Desktop automatisch über Smithery :

npx -y @smithery/cli install mcp-server-webscan --client claude

Manuelle Installation

# Clone the repository git clone <repository-url> cd mcp-server-webscan # Install dependencies npm install # Build the project npm run build

Verwendung

Starten des Servers

npm start

Der Server läuft auf stdio-Transport und ist daher mit MCP-Clients wie Claude Desktop kompatibel.

Verfügbare Tools

fetch-page
- Ruft eine Webseite ab und konvertiert sie in Markdown.
- Parameter:
  - url (erforderlich): URL der abzurufenden Seite.
  - selector (optional): CSS-Selektor zum Ansprechen bestimmter Inhalte.
extract-links
- Extrahiert alle Links einer Webseite mit ihrem Text.
- Parameter:
  - url (erforderlich): URL der zu analysierenden Seite.
  - baseUrl (optional): Basis-URL zum Filtern von Links.
  - limit (optional, Standard: 100): Maximale Anzahl der zurückzugebenden Links.
crawl-site
- Durchsucht eine Website rekursiv bis zu einer angegebenen Tiefe.
- Parameter:
  - url (erforderlich): Start-URL zum Crawlen.
  - maxDepth (optional, Standard: 2): Maximale Crawltiefe (0-5).
check-links
- Überprüft, ob auf einer Seite defekte Links vorhanden sind.
- Parameter:
  - url (erforderlich): URL, auf die Links geprüft werden sollen.
find-patterns
- Sucht URLs, die einem bestimmten Muster entsprechen.
- Parameter:
  - url (erforderlich): URL, in der gesucht werden soll.
  - pattern (erforderlich): JavaScript-kompatibles Regex-Muster zum Abgleichen von URLs.
generate-site-map
- Generiert durch Crawlen eine einfache XML-Sitemap.
- Parameter:
  - url (erforderlich): Stamm-URL für das Sitemap-Crawlen.
  - maxDepth (optional, Standard: 2): Maximale Crawl-Tiefe zum Erkennen von URLs (0-5).
  - limit (optional, Standard: 1000): Maximale Anzahl von URLs, die in die Sitemap aufgenommen werden sollen.

Beispielverwendung mit Claude Desktop

Konfigurieren Sie den Server in Ihren Claude Desktop-Einstellungen:

{ "mcpServers": { "webscan": { "command": "node", "args": ["path/to/mcp-server-webscan/build/index.js"], // Corrected path "env": { "NODE_ENV": "development", "LOG_LEVEL": "info" // Example: Set log level via env var } } } }

Nutzen Sie die Tools in Ihren Gesprächen:

Could you fetch the content from https://example.com and convert it to Markdown?

Entwicklung

Voraussetzungen

Node.js >= 18
npm

Projektstruktur (nach der Refaktorierung)

mcp-server-webscan/ ├── src/ │ ├── config/ │ │ └── ConfigurationManager.ts │ ├── services/ │ │ ├── CheckLinksService.ts │ │ ├── CrawlSiteService.ts │ │ ├── ExtractLinksService.ts │ │ ├── FetchPageService.ts │ │ ├── FindPatternsService.ts │ │ ├── GenerateSitemapService.ts │ │ └── index.ts │ ├── tools/ │ │ ├── checkLinksTool.ts │ │ ├── checkLinksToolParams.ts │ │ ├── crawlSiteTool.ts │ │ ├── crawlSiteToolParams.ts │ │ ├── extractLinksTool.ts │ │ ├── extractLinksToolParams.ts │ │ ├── fetchPageTool.ts │ │ ├── fetchPageToolParams.ts │ │ ├── findPatterns.ts │ │ ├── findPatternsToolParams.ts │ │ ├── generateSitemapTool.ts │ │ ├── generateSitemapToolParams.ts │ │ └── index.ts │ ├── types/ │ │ ├── checkLinksTypes.ts │ │ ├── crawlSiteTypes.ts │ │ ├── extractLinksTypes.ts │ │ ├── fetchPageTypes.ts │ │ ├── findPatternsTypes.ts │ │ ├── generateSitemapTypes.ts │ │ └── index.ts │ ├── utils/ │ │ ├── errors.ts │ │ ├── index.ts │ │ ├── logger.ts │ │ ├── markdownConverter.ts │ │ └── webUtils.ts │ ├── initialize.ts │ └── index.ts # Main server entry point ├── build/ # Compiled JavaScript (Corrected) ├── node_modules/ ├── .clinerules ├── .gitignore ├── Dockerfile ├── LICENSE ├── mcp-consistant-servers-guide.md ├── package.json ├── package-lock.json ├── README.md ├── RFC-2025-001-Refactor.md ├── smithery.yaml └── tsconfig.json

Gebäude

npm run build

Entwicklungsmodus

npm run dev

Ausführen von Evaluierungen

Das Evals-Paket lädt einen MCP-Client, der anschließend die Datei index.ts ausführt, sodass zwischen den Tests kein Neuaufbau erforderlich ist. Sie können Umgebungsvariablen laden, indem Sie dem Befehl npx voranstellen. Die vollständige Dokumentation finden Sie hier .

OPENAI_API_KEY=your-key npx mcp-eval src/evals/evals.ts src/tools/extractLinksTool.ts

Fehlerbehandlung

Der Server implementiert eine umfassende Fehlerbehandlung:

Ungültige Parameter
Netzwerkfehler
Fehler beim Parsen von Inhalten
URL-Validierung

Alle Fehler werden gemäß der MCP-Spezifikation ordnungsgemäß formatiert.

Beitragen

Forken Sie das Repository
Erstellen Sie Ihren Feature-Zweig ( git checkout -b feature/amazing-feature )
Übernehmen Sie Ihre Änderungen ( git commit -m 'Add some amazing feature' )
Pushen zum Zweig ( git push origin feature/amazing-feature )
Öffnen einer Pull-Anfrage

Lizenz

MIT-Lizenz – Einzelheiten finden Sie in der Datei LICENSE

Deploy Server

security – no known vulnerabilities

license - not tested

quality - confirmed to work

How are these scores calculated?

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Tools

Ermöglicht das Scannen und Analysieren von Webinhalten durch Abrufen, Analysieren und Extrahieren von Informationen von Webseiten mithilfe von Tools wie Seitenabruf, Linkextraktion, Site-Crawling und mehr.

Related Resources

Reddit Discussion about this server

Related MCP Servers

Fetch MCP Server
zcaceres
A
security
-
license
A
quality
Provides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.
Last updated -
4
376
610
MIT License
MCP Access Server
-
security
-
license
-
quality
Enables text extraction from web pages and PDFs, and execution of predefined commands, enhancing content processing and automation capabilities.
Fetch MCP Server
tokenizin
A
security
-
license
A
quality
Provides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.
Last updated -
4
104,162
2
Fetch MCP Server
phpmac
-
security
-
license
-
quality
Provides functionality to fetch and transform web content in various formats (HTML, JSON, plain text, and Markdown) through simple API calls.
Last updated -
104,162
1

View all related MCP servers

MCP Webscan Server

MCP Webscan Server

Merkmale

Installation

Installation über Smithery

Manuelle Installation

Verwendung

Starten des Servers

Verfügbare Tools

Beispielverwendung mit Claude Desktop

Entwicklung

Voraussetzungen

Projektstruktur (nach der Refaktorierung)

Gebäude

Entwicklungsmodus

Ausführen von Evaluierungen

Fehlerbehandlung

Beitragen

Lizenz

Tools

Related Resources

Related MCP Servers

Fetch MCP Server

MCP Access Server

Fetch MCP Server

Fetch MCP Server

Appeared in Searches

New MCP Servers

MCP directory API