WebforAI Text Extractor MCP Server

MIT License
2

Integrations

  • Deploys to Cloudflare Workers for serverless hosting with global distribution of the MCP server.

  • Provides a serverless deployment platform for the MCP server with global distribution.

  • Offers one-click deployment of the MCP server from the GitHub repository.

Извлекатель текста WebforAI - сервер MCP

Сервер Model Context Protocol (MCP) на базе Cloudflare Workers, который извлекает простой текст из веб-страниц с помощью WebforAI .

🌟 Что такое WebforAI?

WebforAI — это мощная библиотека, разработанная для того, чтобы сделать веб-контент доступным для моделей ИИ. Она предоставляет инструменты для:

  • Преобразовать HTML в чистый, структурированный Markdown
  • Извлекайте значимый контент из веб-страниц
  • Интеллектуальная обработка таблиц, ссылок и изображений
  • Подготовка веб-контента для потребления ИИ

Этот сервер MCP использует возможности WebforAI для извлечения простого текста из любого URL-адреса веб-страницы, что упрощает передачу веб-контента в модели ИИ через протокол контекста модели.

📋 Особенности

  • Простой API : извлечение текста с любой веб-страницы с помощью одного вызова API
  • Чистый вывод : получение хорошо отформатированного текста Markdown без HTML-шума.
  • Обработка ошибок : надежная обработка ошибок для невыполненных запросов.
  • Cloudflare Workers : бессерверное развертывание с глобальным распределением
  • Совместимость с MCP : работает с любым клиентом MCP, таким как Claude Desktop или Cloudflare AI Playground.

🚀 Начало работы

Развертывание в Cloudflare Workers

Это развернет ваш сервер MCP по URL-адресу вида: webforai-mcp-server.<your-account>.workers.dev/sse

Местное развитие

  1. Клонируйте этот репозиторий:
    git clone https://github.com/yutakobayashidev/webforai-mcp-server.git cd webforai-mcp-server
  2. Установите зависимости:
    pnpm install
  3. Запустите сервер разработки:
    pnpm dev
  4. Ваш сервер будет доступен по адресу http://localhost:8787

🔧 Использование инструмента извлечения текста

Инструмент extractWebPageText принимает URL-адрес веб-страницы и возвращает извлеченное текстовое содержимое в формате markdown:

{ "url": "https://example.com/page" }

Ответ будет содержать извлеченный текст в формате Markdown, включая:

  • Ссылки преобразованы в обычный текст
  • Таблицы преобразованы в обычный текст
  • Изображения скрыты

🔌 Подключение к клиентам MCP

Площадка для искусственного интеллекта Cloudflare

  1. Перейти на площадку для изучения искусственного интеллекта Cloudflare
  2. Введите URL-адрес развернутого сервера MCP ( webforai-mcp-server.<your-account>.workers.dev/sse )
  3. Теперь вы можете использовать инструмент для извлечения текста прямо из игровой площадки!

Клод Десктоп

Чтобы подключиться к вашему MCP-серверу из Claude Desktop:

  1. Следуйте краткому руководству Anthropic
  2. В Claude Desktop перейдите в Настройки > Разработчик > Изменить конфигурацию.
  3. Обновите с помощью этой конфигурации:
{ "mcpServers": { "webforaiExtractor": { "command": "npx", "args": [ "mcp-remote", "http://localhost:8787/sse" // or webforai-mcp-server.your-account.workers.dev/sse ] } } }
  1. Перезапустите Claude, и вы увидите, что инструмент извлечения текста стал доступен.

📚 Узнать больше

📄 Лицензия

Массачусетский технологический институт

-
security - not tested
A
license - permissive license
-
quality - not tested

Сервер на базе Cloudflare Workers, который извлекает чистый, отформатированный текст с веб-страниц с помощью WebforAI и делает его доступным для моделей ИИ через протокол контекста модели.

  1. 🌟 Что такое WebforAI?
    1. 📋 Особенности
      1. 🚀 Начало работы
        1. Развертывание в Cloudflare Workers
        2. Местное развитие
      2. 🔧 Использование инструмента извлечения текста
        1. 🔌 Подключение к клиентам MCP
          1. Площадка для искусственного интеллекта Cloudflare
          2. Клод Десктоп
        2. 📚 Узнать больше
          1. 📄 Лицензия

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              A production-ready Model Context Protocol server that enables language models to leverage AI-powered web scraping capabilities, offering tools for transforming webpages to markdown, extracting structured data, and executing AI-powered web searches.
              Last updated -
              3
              16
              Python
              MIT License
              • Apple
            • -
              security
              -
              license
              -
              quality
              An open standard server implementation that enables AI assistants to directly access APIs and services through Model Context Protocol, built using Cloudflare Workers for scalability.
              Last updated -
              TypeScript
            • A
              security
              A
              license
              A
              quality
              A Model Context Protocol server enabling AI assistants to scrape web content with high accuracy and flexibility, supporting multiple scraping modes and content formatting options.
              Last updated -
              4
              222
              1
              TypeScript
              MIT License
              • Linux
              • Apple
            • A
              security
              A
              license
              A
              quality
              A server that leverages Playwright for automated browser testing and integrates with Cloudflare Workers, enabling AI assistants to control web browsers for navigation, interaction, and screenshots.
              Last updated -
              21
              56,029
              37
              TypeScript
              Apache 2.0

            View all related MCP servers

            ID: 48hhtkok90