WebforAI テキスト抽出ツール - MCP サーバー
WebforAIを使用して Web ページからプレーンテキストを抽出する Cloudflare Workers ベースの Model Context Protocol (MCP) サーバー。
🌟 WebforAIとは何ですか?
WebforAIは、WebコンテンツをAIモデルで利用できるように設計された強力なライブラリです。以下のツールを提供します。
HTML をクリーンで構造化された Markdown に変換する
ウェブページから意味のあるコンテンツを抽出する
表、リンク、画像をインテリジェントに処理する
AIによる消費向けにWebコンテンツを準備する
この MCP サーバーは、WebforAI の機能を活用して任意の Web ページ URL からプレーン テキストを抽出し、モデル コンテキスト プロトコルを通じて Web コンテンツを AI モデルに簡単に取り込めるようにします。
Related MCP server: Remote MCP Server for Website Analysis
📋 機能
シンプルなAPI : 1回のAPI呼び出しで任意のWebページからテキストを抽出します
クリーンな出力: HTMLノイズのない、適切にフォーマットされたMarkdownテキストを受け取ります
エラー処理: 失敗したリクエストに対する堅牢なエラー処理
Cloudflare Workers : グローバル分散によるサーバーレスデプロイメント
MCP 互換: Claude Desktop や Cloudflare AI Playground などのあらゆる MCP クライアントで動作します
🚀 はじめに
Cloudflare Workersへのデプロイ
これにより、MCP サーバーが次のような URL にデプロイされます: webforai-mcp-server.<your-account>.workers.dev/sse
地域開発
このリポジトリをクローンします:
git clone https://github.com/yutakobayashidev/webforai-mcp-server.git cd webforai-mcp-server依存関係をインストールします:
pnpm install開発サーバーを起動します。
pnpm devサーバーは
http://localhost:8787で利用できます。
🔧 テキスト抽出ツールの使用
extractWebPageTextツールは、Web ページへの URL を受け入れ、抽出したテキスト コンテンツをマークダウン形式で返します。
応答には、次の内容を含む、Markdown 形式で抽出されたテキストが含まれます。
リンクをプレーンテキストに変換
表をプレーンテキストに変換
画像は非表示です
🔌 MCP クライアントへの接続
Cloudflare AIプレイグラウンド
デプロイされた MCP サーバーの URL を入力します (
webforai-mcp-server.<your-account>.workers.dev/sse)プレイグラウンドから直接テキスト抽出ツールを使用できるようになりました。
クロードデスクトップ
Claude Desktop から MCP サーバーに接続するには:
Claude Desktopで設定 > 開発者 > 設定の編集に進みます
次の構成で更新します。
Claudeを再起動すると、テキスト抽出ツールが利用可能になります。
📚詳細はこちら
📄 ライセンス
マサチューセッツ工科大学