WebforAI Text Extractor MCP Server

MIT License
2

Integrations

  • Deploys to Cloudflare Workers for serverless hosting with global distribution of the MCP server.

  • Provides a serverless deployment platform for the MCP server with global distribution.

  • Offers one-click deployment of the MCP server from the GitHub repository.

Extractor de texto WebforAI - Servidor MCP

Un servidor de Protocolo de contexto de modelo (MCP) basado en Cloudflare Workers que extrae texto sin formato de páginas web mediante WebforAI .

🌟¿Qué es WebforAI?

WebforAI es una potente biblioteca diseñada para que el contenido web sea accesible para los modelos de IA. Proporciona herramientas para:

  • Convertir HTML a Markdown limpio y estructurado
  • Extraer contenido significativo de las páginas web
  • Procese tablas, enlaces e imágenes de forma inteligente
  • Preparar contenido web para el consumo de IA

Este servidor MCP aprovecha las capacidades de WebforAI para extraer texto sin formato de la URL de cualquier página web, lo que facilita la introducción de contenido web en los modelos de IA a través del Protocolo de contexto de modelo.

📋 Características

  • API simple : extrae texto de cualquier página web con una sola llamada API
  • Salida limpia : Reciba texto Markdown bien formateado sin ruido HTML
  • Manejo de errores : Manejo robusto de errores para solicitudes fallidas
  • Cloudflare Workers : Implementación sin servidor con distribución global
  • Compatible con MCP : funciona con cualquier cliente MCP como Claude Desktop o Cloudflare AI Playground

🚀 Primeros pasos

Implementar en Cloudflare Workers

Esto implementará su servidor MCP en una URL como: webforai-mcp-server.<your-account>.workers.dev/sse

Desarrollo local

  1. Clonar este repositorio:
    git clone https://github.com/yutakobayashidev/webforai-mcp-server.git cd webforai-mcp-server
  2. Instalar dependencias:
    pnpm install
  3. Inicie el servidor de desarrollo:
    pnpm dev
  4. Su servidor estará disponible en http://localhost:8787

🔧Usando la herramienta de extracción de texto

La herramienta extractWebPageText acepta una URL a una página web y devuelve el contenido de texto extraído en formato Markdown:

{ "url": "https://example.com/page" }

La respuesta contendrá el texto extraído en formato Markdown, con:

  • Enlaces convertidos a texto sin formato
  • Tablas convertidas a texto sin formato
  • Imágenes ocultas

🔌 Conexión con clientes MCP

Zona de juegos de IA de Cloudflare

  1. Ir a Cloudflare AI Playground
  2. Ingrese la URL de su servidor MCP implementado ( webforai-mcp-server.<your-account>.workers.dev/sse )
  3. ¡Ahora puedes usar tu herramienta de extracción de texto directamente desde el área de juegos!

Escritorio de Claude

Para conectarse a su servidor MCP desde Claude Desktop:

  1. Siga la guía de inicio rápido de Anthropic
  2. En Claude Desktop, vaya a Configuración > Desarrollador > Editar configuración
  3. Actualizar con esta configuración:
{ "mcpServers": { "webforaiExtractor": { "command": "npx", "args": [ "mcp-remote", "http://localhost:8787/sse" // or webforai-mcp-server.your-account.workers.dev/sse ] } } }
  1. Reinicie Claude y debería ver que la herramienta de extracción de texto está disponible.

📚 Más información

📄 Licencia

Instituto Tecnológico de Massachusetts (MIT)

-
security - not tested
A
license - permissive license
-
quality - not tested

Un servidor basado en Cloudflare Workers que extrae texto limpio y formateado de páginas web mediante WebforAI y lo hace accesible a los modelos de IA a través del Protocolo de contexto de modelo.

  1. 🌟¿Qué es WebforAI?
    1. 📋 Características
      1. 🚀 Primeros pasos
        1. Implementar en Cloudflare Workers
        2. Desarrollo local
      2. 🔧Usando la herramienta de extracción de texto
        1. 🔌 Conexión con clientes MCP
          1. Zona de juegos de IA de Cloudflare
          2. Escritorio de Claude
        2. 📚 Más información
          1. 📄 Licencia

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              A production-ready Model Context Protocol server that enables language models to leverage AI-powered web scraping capabilities, offering tools for transforming webpages to markdown, extracting structured data, and executing AI-powered web searches.
              Last updated -
              3
              16
              Python
              MIT License
              • Apple
            • -
              security
              -
              license
              -
              quality
              An open standard server implementation that enables AI assistants to directly access APIs and services through Model Context Protocol, built using Cloudflare Workers for scalability.
              Last updated -
              TypeScript
            • A
              security
              A
              license
              A
              quality
              A Model Context Protocol server enabling AI assistants to scrape web content with high accuracy and flexibility, supporting multiple scraping modes and content formatting options.
              Last updated -
              4
              222
              1
              TypeScript
              MIT License
              • Linux
              • Apple
            • A
              security
              A
              license
              A
              quality
              A server that leverages Playwright for automated browser testing and integrates with Cloudflare Workers, enabling AI assistants to control web browsers for navigation, interaction, and screenshots.
              Last updated -
              21
              56,029
              37
              TypeScript
              Apache 2.0

            View all related MCP servers

            ID: 48hhtkok90