Integrations
Сервер веб-сканирования MCP
Сервер Model Context Protocol (MCP) для сканирования и анализа веб-контента. Этот сервер предоставляет инструменты для извлечения, анализа и извлечения информации из веб-страниц.
Функции
- Извлечение страниц : преобразование веб-страниц в Markdown для легкого анализа
- Извлечение ссылок : извлечение и анализ ссылок с веб-страниц.
- Сканирование сайтов : рекурсивное сканирование веб-сайтов для обнаружения контента.
- Проверка ссылок : выявление неработающих ссылок на веб-страницах.
- Сопоставление шаблонов : поиск URL-адресов, соответствующих определенным шаблонам.
- Генерация карты сайта : создание XML-карт сайта для веб-сайтов
Установка
Установка через Smithery
Чтобы автоматически установить Webscan for Claude Desktop через Smithery :
Ручная установка
Использование
Запуск сервера
Сервер работает на stdio-транспорте, что делает его совместимым с клиентами MCP, такими как Claude Desktop.
Доступные инструменты
fetch-page
- Извлекает веб-страницу и преобразует ее в Markdown.
- Параметры:
url
(обязательно): URL-адрес страницы для загрузки.selector
(необязательно): селектор CSS для выбора определенного контента.
extract-links
- Извлекает все ссылки с веб-страницы вместе с их текстом.
- Параметры:
url
(обязательно): URL-адрес страницы для анализа.baseUrl
(необязательно): базовый URL для фильтрации ссылок.limit
(необязательно, по умолчанию: 100): максимальное количество возвращаемых ссылок.
crawl-site
- Рекурсивно сканирует веб-сайт до указанной глубины.
- Параметры:
url
(обязательно): Начальный URL для сканирования.maxDepth
(необязательно, по умолчанию: 2): максимальная глубина сканирования (0-5).
check-links
- Проверяет наличие неработающих ссылок на странице.
- Параметры:
url
(обязательно): URL для проверки ссылок.
find-patterns
- Находит URL-адреса, соответствующие определенному шаблону.
- Параметры:
url
(обязательно): URL для поиска.pattern
(обязательно): совместимый с JavaScript шаблон регулярного выражения для сопоставления URL-адресов.
generate-site-map
- Создает простую XML-карту сайта путем сканирования.
- Параметры:
url
(обязательно): Корневой URL для сканирования карты сайта.maxDepth
(необязательно, по умолчанию: 2): максимальная глубина сканирования для обнаружения URL-адресов (0-5).limit
(необязательно, по умолчанию: 1000): максимальное количество URL-адресов для включения в карту сайта.
Пример использования с Claude Desktop
- Настройте сервер в настройках Claude Desktop:
- Используйте инструменты в своих беседах:
Разработка
Предпосылки
- Node.js >= 18
- нпм
Структура проекта (после рефакторинга)
Здание
Режим разработки
Запуск оценок
Пакет evals загружает клиент mcp, который затем запускает файл index.ts, поэтому нет необходимости перестраиваться между тестами. Вы можете загрузить переменные среды, указав префикс команды npx. Полную документацию можно найти здесь .
Обработка ошибок
На сервере реализована комплексная обработка ошибок:
- Неверные параметры
- Ошибки сети
- Ошибки анализа контента
- Проверка URL-адреса
Все ошибки правильно отформатированы в соответствии со спецификацией MCP.
Внося вклад
- Форк репозитория
- Создайте ветку функций (
git checkout -b feature/amazing-feature
) - Зафиксируйте свои изменения (
git commit -m 'Add some amazing feature'
) - Отправить в ветку (
git push origin feature/amazing-feature
) - Открыть запрос на извлечение
Лицензия
Лицензия MIT — подробности см. в файле LICENSE
You must be authenticated.
Позволяет сканировать и анализировать веб-контент путем извлечения, анализа и извлечения информации с веб-страниц с использованием таких инструментов, как извлечение страниц, извлечение ссылок, сканирование сайта и т. д.
- Функции
- Установка
- Использование
- Пример использования с Claude Desktop
- Разработка
- Запуск оценок
- Обработка ошибок
- Внося вклад
- Лицензия
Related Resources
Related MCP Servers
- AsecurityFlicenseAqualityProvides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.Last updated -4137,083150TypeScript
- AsecurityAlicenseAqualityEnables text extraction from web pages and PDFs, and execution of predefined commands, enhancing content processing and automation capabilities.Last updated -3TypeScriptMIT License
- -securityFlicense-qualityProvides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.Last updated -137,0831
- -security-license-qualityProvides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown with support for custom headers.Last updated -137,083TypeScript