Извлекатель текста WebforAI - сервер MCP
Сервер Model Context Protocol (MCP) на базе Cloudflare Workers, который извлекает простой текст из веб-страниц с помощью WebforAI .
🌟 Что такое WebforAI?
WebforAI — это мощная библиотека, разработанная для того, чтобы сделать веб-контент доступным для моделей ИИ. Она предоставляет инструменты для:
- Преобразовать HTML в чистый, структурированный Markdown
- Извлекайте значимый контент из веб-страниц
- Интеллектуальная обработка таблиц, ссылок и изображений
- Подготовка веб-контента для потребления ИИ
Этот сервер MCP использует возможности WebforAI для извлечения простого текста из любого URL-адреса веб-страницы, что упрощает передачу веб-контента в модели ИИ через протокол контекста модели.
📋 Особенности
- Простой API : извлечение текста с любой веб-страницы с помощью одного вызова API
- Чистый вывод : получение хорошо отформатированного текста Markdown без HTML-шума.
- Обработка ошибок : надежная обработка ошибок для невыполненных запросов.
- Cloudflare Workers : бессерверное развертывание с глобальным распределением
- Совместимость с MCP : работает с любым клиентом MCP, таким как Claude Desktop или Cloudflare AI Playground.
🚀 Начало работы
Развертывание в Cloudflare Workers
Это развернет ваш сервер MCP по URL-адресу вида: webforai-mcp-server.<your-account>.workers.dev/sse
Местное развитие
- Клонируйте этот репозиторий:
- Установите зависимости:
- Запустите сервер разработки:
- Ваш сервер будет доступен по адресу
http://localhost:8787
🔧 Использование инструмента извлечения текста
Инструмент extractWebPageText
принимает URL-адрес веб-страницы и возвращает извлеченное текстовое содержимое в формате markdown:
Ответ будет содержать извлеченный текст в формате Markdown, включая:
- Ссылки преобразованы в обычный текст
- Таблицы преобразованы в обычный текст
- Изображения скрыты
🔌 Подключение к клиентам MCP
Площадка для искусственного интеллекта Cloudflare
- Перейти на площадку для изучения искусственного интеллекта Cloudflare
- Введите URL-адрес развернутого сервера MCP (
webforai-mcp-server.<your-account>.workers.dev/sse
) - Теперь вы можете использовать инструмент для извлечения текста прямо из игровой площадки!
Клод Десктоп
Чтобы подключиться к вашему MCP-серверу из Claude Desktop:
- Следуйте краткому руководству Anthropic
- В Claude Desktop перейдите в Настройки > Разработчик > Изменить конфигурацию.
- Обновите с помощью этой конфигурации:
- Перезапустите Claude, и вы увидите, что инструмент извлечения текста стал доступен.
📚 Узнать больше
- Документация WebforAI
- Модель контекстного протокола
- Работники Cloudflare
- Искусственный интеллект Cloudflare
📄 Лицензия
Массачусетский технологический институт
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Сервер на базе Cloudflare Workers, который извлекает чистый, отформатированный текст с веб-страниц с помощью WebforAI и делает его доступным для моделей ИИ через протокол контекста модели.
Related MCP Servers
- AsecurityAlicenseAqualityA production-ready Model Context Protocol server that enables language models to leverage AI-powered web scraping capabilities, offering tools for transforming webpages to markdown, extracting structured data, and executing AI-powered web searches.Last updated -316PythonMIT License
- -security-license-qualityAn open standard server implementation that enables AI assistants to directly access APIs and services through Model Context Protocol, built using Cloudflare Workers for scalability.Last updated -TypeScript
- AsecurityAlicenseAqualityA Model Context Protocol server enabling AI assistants to scrape web content with high accuracy and flexibility, supporting multiple scraping modes and content formatting options.Last updated -4172TypeScriptMIT License
- AsecurityAlicenseAqualityA server that leverages Playwright for automated browser testing and integrates with Cloudflare Workers, enabling AI assistants to control web browsers for navigation, interaction, and screenshots.Last updated -2170,03656TypeScriptApache 2.0