Mozilla 読みやすさパーサー MCP サーバー
ウェブページのコンテンツを抽出し、LLMに最適化されたクリーンなMarkdownに変換するモデルコンテキストプロトコル(MCP)サーバーです。記事のタイトル、メインコンテンツ、抜粋、署名、サイト名を返します。Mozillaの読みやすさアルゴリズムを使用し、広告、ナビゲーション、フッター、その他の不要な要素を削除しながら、コアコンテンツの構造を維持します。MCPの詳細はこちら。
特徴
広告、ナビゲーション、フッター、その他の不要なコンテンツを削除します
クリーンな HTML をフォーマットされた Markdown に変換します (Turndown も使用)
記事のメタデータ(タイトル、抜粋、署名、サイト名)を返します
エラーを適切に処理する
Related MCP server: Skrape MCP Server
ただフェッチするだけではダメですか?
単純なフェッチ要求とは異なり、このサーバーは次の処理を行います。
Mozilla の読みやすさアルゴリズムを使用して、関連するコンテンツのみを抽出します
広告、ポップアップ、ナビゲーションメニューなどのノイズを排除します
不要なHTML/CSSを削除することでトークンの使用量を削減します
LLM処理を向上させるために一貫したマークダウンフォーマットを提供します
コンテンツに関する有用なメタデータが含まれています
インストール
Smithery経由でインストール
Smithery経由で Claude Desktop 用の Mozilla Readability Parser を自動的にインストールするには:
手動インストール
ツールリファレンス
parse
Web ページのコンテンツを取得して、クリーンな Markdown に変換します。
引数:
戻り値:
Claude Desktopでの使用
claude_desktop_config.jsonに追加します:
依存関係
@mozilla/readability - コンテンツ抽出
turndown - HTMLからMarkdownへの変換
jsdom - DOM解析
axios - HTTPリクエスト
ライセンス
マサチューセッツ工科大学