Skip to main content
Glama

WebforAI Text Extractor MCP Server

Extractor de texto WebforAI - Servidor MCP

Un servidor de Protocolo de contexto de modelo (MCP) basado en Cloudflare Workers que extrae texto sin formato de páginas web mediante WebforAI .

🌟¿Qué es WebforAI?

WebforAI es una potente biblioteca diseñada para que el contenido web sea accesible para los modelos de IA. Proporciona herramientas para:

  • Convertir HTML a Markdown limpio y estructurado

  • Extraer contenido significativo de las páginas web

  • Procese tablas, enlaces e imágenes de forma inteligente

  • Preparar contenido web para el consumo de IA

Este servidor MCP aprovecha las capacidades de WebforAI para extraer texto sin formato de la URL de cualquier página web, lo que facilita la introducción de contenido web en los modelos de IA a través del Protocolo de contexto de modelo.

Related MCP server: Remote MCP Server for Website Analysis

📋 Características

  • API simple : extrae texto de cualquier página web con una sola llamada API

  • Salida limpia : Reciba texto Markdown bien formateado sin ruido HTML

  • Manejo de errores : Manejo robusto de errores para solicitudes fallidas

  • Cloudflare Workers : Implementación sin servidor con distribución global

  • Compatible con MCP : funciona con cualquier cliente MCP como Claude Desktop o Cloudflare AI Playground

🚀 Primeros pasos

Implementar en Cloudflare Workers

Implementar en trabajadores

Esto implementará su servidor MCP en una URL como: webforai-mcp-server.<your-account>.workers.dev/sse

Desarrollo local

  1. Clonar este repositorio:

    git clone https://github.com/yutakobayashidev/webforai-mcp-server.git cd webforai-mcp-server
  2. Instalar dependencias:

    pnpm install
  3. Inicie el servidor de desarrollo:

    pnpm dev
  4. Su servidor estará disponible en http://localhost:8787

🔧Usando la herramienta de extracción de texto

La herramienta extractWebPageText acepta una URL a una página web y devuelve el contenido de texto extraído en formato Markdown:

{ "url": "https://example.com/page" }

La respuesta contendrá el texto extraído en formato Markdown, con:

  • Enlaces convertidos a texto sin formato

  • Tablas convertidas a texto sin formato

  • Imágenes ocultas

🔌 Conexión con clientes MCP

Zona de juegos de IA de Cloudflare

  1. Ir a Cloudflare AI Playground

  2. Ingrese la URL de su servidor MCP implementado ( webforai-mcp-server.<your-account>.workers.dev/sse )

  3. ¡Ahora puedes usar tu herramienta de extracción de texto directamente desde el área de juegos!

Escritorio de Claude

Para conectarse a su servidor MCP desde Claude Desktop:

  1. Siga la guía de inicio rápido de Anthropic

  2. En Claude Desktop, vaya a Configuración > Desarrollador > Editar configuración

  3. Actualizar con esta configuración:

{ "mcpServers": { "webforaiExtractor": { "command": "npx", "args": [ "mcp-remote", "http://localhost:8787/sse" // or webforai-mcp-server.your-account.workers.dev/sse ] } } }
  1. Reinicie Claude y debería ver que la herramienta de extracción de texto está disponible.

📚 Más información

📄 Licencia

Instituto Tecnológico de Massachusetts (MIT)

-
security - not tested
A
license - permissive license
-
quality - not tested

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/yutakobayashidev/webforai-mcp-server'

If you have feedback or need assistance with the MCP directory API, please join our Discord server