WebforAI Text Extractor MCP Server

MIT License
2

Integrations

  • Deploys to Cloudflare Workers for serverless hosting with global distribution of the MCP server.

  • Provides a serverless deployment platform for the MCP server with global distribution.

  • Offers one-click deployment of the MCP server from the GitHub repository.

WebforAI 텍스트 추출기 - MCP 서버

WebforAI를 사용하여 웹 페이지에서 일반 텍스트를 추출하는 Cloudflare Workers 기반 MCP(Model Context Protocol) 서버입니다.

🌟 WebforAI란 무엇인가요?

WebforAI는 AI 모델이 웹 콘텐츠에 접근할 수 있도록 설계된 강력한 라이브러리입니다. 다음과 같은 도구를 제공합니다.

  • HTML을 깔끔하고 구조화된 마크다운으로 변환
  • 웹 페이지에서 의미 있는 콘텐츠 추출
  • 테이블, 링크 및 이미지를 지능적으로 처리합니다.
  • AI 소비를 위한 웹 콘텐츠 준비

이 MCP 서버는 WebforAI의 기능을 활용하여 모든 웹 페이지 URL에서 일반 텍스트를 추출하고, Model Context Protocol을 통해 웹 콘텐츠를 AI 모델에 쉽게 공급할 수 있도록 합니다.

📋 특징

  • 간단한 API : 단일 API 호출로 모든 웹 페이지에서 텍스트를 추출합니다.
  • 깔끔한 출력 : HTML 노이즈 없이 잘 포맷된 마크다운 텍스트를 받습니다.
  • 오류 처리 : 실패한 요청에 대한 강력한 오류 처리
  • Cloudflare Workers : 글로벌 배포를 통한 서버리스 배포
  • MCP 호환 : Claude Desktop 또는 Cloudflare AI Playground와 같은 모든 MCP 클라이언트와 호환됩니다.

🚀 시작하기

Cloudflare Workers에 배포

이렇게 하면 MCP 서버가 webforai-mcp-server.<your-account>.workers.dev/sse 와 같은 URL에 배포됩니다.

지역 개발

  1. 이 저장소를 복제하세요:지엑스피1
  2. 종속성 설치:
    pnpm install
  3. 개발 서버를 시작합니다.
    pnpm dev
  4. 귀하의 서버는 http://localhost:8787 에서 사용 가능합니다.

🔧 텍스트 추출 도구 사용

extractWebPageText 도구는 웹 페이지의 URL을 받아서 추출된 텍스트 콘텐츠를 마크다운 형식으로 반환합니다.

{ "url": "https://example.com/page" }

응답에는 다음과 같은 Markdown 형식의 추출된 텍스트가 포함됩니다.

  • 일반 텍스트로 변환된 링크
  • 일반 텍스트로 변환된 테이블
  • 이미지가 숨겨짐

🔌 MCP 클라이언트에 연결

클라우드플레어 AI 플레이그라운드

  1. Cloudflare AI Playground 로 이동
  2. 배포된 MCP 서버 URL을 입력하세요( webforai-mcp-server.<your-account>.workers.dev/sse )
  3. 이제 플레이그라운드에서 바로 텍스트 추출 도구를 사용할 수 있습니다!

클로드 데스크탑

Claude Desktop에서 MCP 서버에 연결하려면:

  1. Anthropic의 빠른 시작을 따르세요
  2. Claude Desktop에서 설정 > 개발자 > 구성 편집으로 이동합니다.
  3. 다음 구성으로 업데이트:
{ "mcpServers": { "webforaiExtractor": { "command": "npx", "args": [ "mcp-remote", "http://localhost:8787/sse" // or webforai-mcp-server.your-account.workers.dev/sse ] } } }
  1. Claude를 다시 시작하면 텍스트 추출 도구가 사용 가능해지는 것을 볼 수 있습니다.

📚 자세히 알아보기

📄 라이센스

MIT

-
security - not tested
A
license - permissive license
-
quality - not tested

WebforAI를 사용하여 웹 페이지에서 깔끔하고 형식화된 텍스트를 추출하고 Model Context Protocol을 통해 AI 모델에서 액세스할 수 있도록 하는 Cloudflare Workers 기반 서버입니다.

  1. 🌟 WebforAI란 무엇인가요?
    1. 📋 특징
      1. 🚀 시작하기
        1. Cloudflare Workers에 배포
        2. 지역 개발
      2. 🔧 텍스트 추출 도구 사용
        1. 🔌 MCP 클라이언트에 연결
          1. 클라우드플레어 AI 플레이그라운드
          2. 클로드 데스크탑
        2. 📚 자세히 알아보기
          1. 📄 라이센스

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              A production-ready Model Context Protocol server that enables language models to leverage AI-powered web scraping capabilities, offering tools for transforming webpages to markdown, extracting structured data, and executing AI-powered web searches.
              Last updated -
              3
              16
              Python
              MIT License
              • Apple
            • -
              security
              -
              license
              -
              quality
              An open standard server implementation that enables AI assistants to directly access APIs and services through Model Context Protocol, built using Cloudflare Workers for scalability.
              Last updated -
              TypeScript
            • A
              security
              A
              license
              A
              quality
              A Model Context Protocol server enabling AI assistants to scrape web content with high accuracy and flexibility, supporting multiple scraping modes and content formatting options.
              Last updated -
              4
              222
              1
              TypeScript
              MIT License
              • Linux
              • Apple
            • A
              security
              A
              license
              A
              quality
              A server that leverages Playwright for automated browser testing and integrates with Cloudflare Workers, enabling AI assistants to control web browsers for navigation, interaction, and screenshots.
              Last updated -
              21
              56,029
              37
              TypeScript
              Apache 2.0

            View all related MCP servers

            ID: 48hhtkok90