Skip to main content
Glama

WebforAI Text Extractor MCP Server

Извлекатель текста WebforAI - сервер MCP

Сервер Model Context Protocol (MCP) на базе Cloudflare Workers, который извлекает простой текст из веб-страниц с помощью WebforAI .

🌟 Что такое WebforAI?

WebforAI — это мощная библиотека, разработанная для того, чтобы сделать веб-контент доступным для моделей ИИ. Она предоставляет инструменты для:

  • Преобразовать HTML в чистый, структурированный Markdown
  • Извлекайте значимый контент из веб-страниц
  • Интеллектуальная обработка таблиц, ссылок и изображений
  • Подготовка веб-контента для потребления ИИ

Этот сервер MCP использует возможности WebforAI для извлечения простого текста из любого URL-адреса веб-страницы, что упрощает передачу веб-контента в модели ИИ через протокол контекста модели.

📋 Особенности

  • Простой API : извлечение текста с любой веб-страницы с помощью одного вызова API
  • Чистый вывод : получение хорошо отформатированного текста Markdown без HTML-шума.
  • Обработка ошибок : надежная обработка ошибок для невыполненных запросов.
  • Cloudflare Workers : бессерверное развертывание с глобальным распределением
  • Совместимость с MCP : работает с любым клиентом MCP, таким как Claude Desktop или Cloudflare AI Playground.

🚀 Начало работы

Развертывание в Cloudflare Workers

Это развернет ваш сервер MCP по URL-адресу вида: webforai-mcp-server.<your-account>.workers.dev/sse

Местное развитие

  1. Клонируйте этот репозиторий:
    git clone https://github.com/yutakobayashidev/webforai-mcp-server.git cd webforai-mcp-server
  2. Установите зависимости:
    pnpm install
  3. Запустите сервер разработки:
    pnpm dev
  4. Ваш сервер будет доступен по адресу http://localhost:8787

🔧 Использование инструмента извлечения текста

Инструмент extractWebPageText принимает URL-адрес веб-страницы и возвращает извлеченное текстовое содержимое в формате markdown:

{ "url": "https://example.com/page" }

Ответ будет содержать извлеченный текст в формате Markdown, включая:

  • Ссылки преобразованы в обычный текст
  • Таблицы преобразованы в обычный текст
  • Изображения скрыты

🔌 Подключение к клиентам MCP

Площадка для искусственного интеллекта Cloudflare

  1. Перейти на площадку для изучения искусственного интеллекта Cloudflare
  2. Введите URL-адрес развернутого сервера MCP ( webforai-mcp-server.<your-account>.workers.dev/sse )
  3. Теперь вы можете использовать инструмент для извлечения текста прямо из игровой площадки!

Клод Десктоп

Чтобы подключиться к вашему MCP-серверу из Claude Desktop:

  1. Следуйте краткому руководству Anthropic
  2. В Claude Desktop перейдите в Настройки > Разработчик > Изменить конфигурацию.
  3. Обновите с помощью этой конфигурации:
{ "mcpServers": { "webforaiExtractor": { "command": "npx", "args": [ "mcp-remote", "http://localhost:8787/sse" // or webforai-mcp-server.your-account.workers.dev/sse ] } } }
  1. Перезапустите Claude, и вы увидите, что инструмент извлечения текста стал доступен.

📚 Узнать больше

📄 Лицензия

Массачусетский технологический институт

-
security - not tested
A
license - permissive license
-
quality - not tested

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Сервер на базе Cloudflare Workers, который извлекает чистый, отформатированный текст с веб-страниц с помощью WebforAI и делает его доступным для моделей ИИ через протокол контекста модели.

  1. 🌟 Что такое WebforAI?
    1. 📋 Особенности
      1. 🚀 Начало работы
        1. Развертывание в Cloudflare Workers
        2. Местное развитие
      2. 🔧 Использование инструмента извлечения текста
        1. 🔌 Подключение к клиентам MCP
          1. Площадка для искусственного интеллекта Cloudflare
          2. Клод Десктоп
        2. 📚 Узнать больше
          1. 📄 Лицензия

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              A production-ready Model Context Protocol server that enables language models to leverage AI-powered web scraping capabilities, offering tools for transforming webpages to markdown, extracting structured data, and executing AI-powered web searches.
              Last updated -
              3
              16
              Python
              MIT License
              • Apple
            • -
              security
              -
              license
              -
              quality
              An open standard server implementation that enables AI assistants to directly access APIs and services through Model Context Protocol, built using Cloudflare Workers for scalability.
              Last updated -
              TypeScript
            • A
              security
              A
              license
              A
              quality
              A Model Context Protocol server enabling AI assistants to scrape web content with high accuracy and flexibility, supporting multiple scraping modes and content formatting options.
              Last updated -
              4
              17
              2
              TypeScript
              MIT License
              • Linux
              • Apple
            • A
              security
              A
              license
              A
              quality
              A server that leverages Playwright for automated browser testing and integrates with Cloudflare Workers, enabling AI assistants to control web browsers for navigation, interaction, and screenshots.
              Last updated -
              21
              70,036
              56
              TypeScript
              Apache 2.0

            View all related MCP servers

            MCP directory API

            We provide all the information about MCP servers via our MCP API.

            curl -X GET 'https://glama.ai/api/mcp/v1/servers/yutakobayashidev/webforai-mcp-server'

            If you have feedback or need assistance with the MCP directory API, please join our Discord server