Извлекатель текста WebforAI - сервер MCP
Сервер Model Context Protocol (MCP) на базе Cloudflare Workers, который извлекает простой текст из веб-страниц с помощью WebforAI .
🌟 Что такое WebforAI?
WebforAI — это мощная библиотека, разработанная для того, чтобы сделать веб-контент доступным для моделей ИИ. Она предоставляет инструменты для:
Преобразовать HTML в чистый, структурированный Markdown
Извлекайте значимый контент из веб-страниц
Интеллектуальная обработка таблиц, ссылок и изображений
Подготовка веб-контента для потребления ИИ
Этот сервер MCP использует возможности WebforAI для извлечения простого текста из любого URL-адреса веб-страницы, что упрощает передачу веб-контента в модели ИИ через протокол контекста модели.
Related MCP server: Remote MCP Server for Website Analysis
📋 Особенности
Простой API : извлечение текста с любой веб-страницы с помощью одного вызова API
Чистый вывод : получение хорошо отформатированного текста Markdown без HTML-шума.
Обработка ошибок : надежная обработка ошибок для невыполненных запросов.
Cloudflare Workers : бессерверное развертывание с глобальным распределением
Совместимость с MCP : работает с любым клиентом MCP, таким как Claude Desktop или Cloudflare AI Playground.
🚀 Начало работы
Развертывание в Cloudflare Workers
Это развернет ваш сервер MCP по URL-адресу вида: webforai-mcp-server.<your-account>.workers.dev/sse
Местное развитие
Клонируйте этот репозиторий:
git clone https://github.com/yutakobayashidev/webforai-mcp-server.git cd webforai-mcp-serverУстановите зависимости:
pnpm installЗапустите сервер разработки:
pnpm devВаш сервер будет доступен по адресу
http://localhost:8787
🔧 Использование инструмента извлечения текста
Инструмент extractWebPageText принимает URL-адрес веб-страницы и возвращает извлеченное текстовое содержимое в формате markdown:
Ответ будет содержать извлеченный текст в формате Markdown, включая:
Ссылки преобразованы в обычный текст
Таблицы преобразованы в обычный текст
Изображения скрыты
🔌 Подключение к клиентам MCP
Площадка для искусственного интеллекта Cloudflare
Перейти на площадку для изучения искусственного интеллекта Cloudflare
Введите URL-адрес развернутого сервера MCP (
webforai-mcp-server.<your-account>.workers.dev/sse)Теперь вы можете использовать инструмент для извлечения текста прямо из игровой площадки!
Клод Десктоп
Чтобы подключиться к вашему MCP-серверу из Claude Desktop:
Следуйте краткому руководству Anthropic
В Claude Desktop перейдите в Настройки > Разработчик > Изменить конфигурацию.
Обновите с помощью этой конфигурации:
Перезапустите Claude, и вы увидите, что инструмент извлечения текста стал доступен.
📚 Узнать больше
📄 Лицензия
Массачусетский технологический институт