Mozilla 読みやすさパーサー MCP サーバー
ウェブページのコンテンツを抽出し、LLMに最適化されたクリーンなMarkdownに変換するモデルコンテキストプロトコル(MCP)サーバーです。記事のタイトル、メインコンテンツ、抜粋、署名、サイト名を返します。Mozillaの読みやすさアルゴリズムを使用し、広告、ナビゲーション、フッター、その他の不要な要素を削除しながら、コアコンテンツの構造を維持します。MCPの詳細はこちら。
特徴
- 広告、ナビゲーション、フッター、その他の不要なコンテンツを削除します
- クリーンな HTML をフォーマットされた Markdown に変換します (Turndown も使用)
- 記事のメタデータ(タイトル、抜粋、署名、サイト名)を返します
- エラーを適切に処理する
ただフェッチするだけではダメですか?
単純なフェッチ要求とは異なり、このサーバーは次の処理を行います。
- Mozilla の読みやすさアルゴリズムを使用して、関連するコンテンツのみを抽出します
- 広告、ポップアップ、ナビゲーションメニューなどのノイズを排除します
- 不要なHTML/CSSを削除することでトークンの使用量を削減します
- LLM処理を向上させるために一貫したマークダウンフォーマットを提供します
- コンテンツに関する有用なメタデータが含まれています
インストール
Smithery経由でインストール
Smithery経由で Claude Desktop 用の Mozilla Readability Parser を自動的にインストールするには:
手動インストール
ツールリファレンス
parse
Web ページのコンテンツを取得して、クリーンな Markdown に変換します。
引数:
戻り値:
Claude Desktopでの使用
claude_desktop_config.json
に追加します:
依存関係
- @mozilla/readability - コンテンツ抽出
- turndown - HTMLからMarkdownへの変換
- jsdom - DOM解析
- axios - HTTPリクエスト
ライセンス
マサチューセッツ工科大学
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Tools
ウェブページのコンテンツを抽出し、LLMに最適化されたクリーンなMarkdown形式に変換します。記事のタイトル、メインコンテンツ、抜粋、署名、サイト名を返します。Mozillaの読みやすさアルゴリズムを使用し、広告、ナビゲーション、フッター、その他の不要な要素を削除しながら、コアコンテンツの構造を維持します。
Related MCP Servers
- AsecurityAlicenseAqualityEnables web content scanning and analysis by fetching, analyzing, and extracting information from web pages using tools like page fetching, link extraction, site crawling, and more.Last updated -69TypeScriptMIT License
Skrape MCP Serverofficial
AsecurityAlicenseAqualityThis server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.Last updated -19JavaScriptMIT License- -securityAlicense-qualityEnables retrieval and processing of web page content for LLMs by converting HTML to markdown, with support for content truncation and pagination.Last updated -11PythonMIT License
- -securityAlicense-qualityA Python implementation of an MCP server that extracts webpage content, removes ads and non-essential elements, and transforms it into clean, LLM-optimized Markdown.Last updated -2PythonMIT License
Appeared in Searches
- Using LLMs for Retrieving and Processing Web Content
- A microcontroller with image processing capabilities
- A service for finding jobs on Indeed and applying to them automatically based on a resume
- A server for finding job listings on Indeed
- A server for summarizing content and extracting summaries from videos