remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Integrations
Uses Mozilla's Readability algorithm to extract and transform webpage content into clean Markdown by removing ads, navigation, footers and non-essential elements while preserving core content structure.
Mozilla 読みやすさパーサー MCP サーバー
ウェブページのコンテンツを抽出し、LLMに最適化されたクリーンなMarkdownに変換するモデルコンテキストプロトコル(MCP)サーバーです。記事のタイトル、メインコンテンツ、抜粋、署名、サイト名を返します。Mozillaの読みやすさアルゴリズムを使用し、広告、ナビゲーション、フッター、その他の不要な要素を削除しながら、コアコンテンツの構造を維持します。MCPの詳細はこちら。
特徴
- 広告、ナビゲーション、フッター、その他の不要なコンテンツを削除します
- クリーンな HTML をフォーマットされた Markdown に変換します (Turndown も使用)
- 記事のメタデータ(タイトル、抜粋、署名、サイト名)を返します
- エラーを適切に処理する
ただフェッチするだけではダメですか?
単純なフェッチ要求とは異なり、このサーバーは次の処理を行います。
- Mozilla の読みやすさアルゴリズムを使用して、関連するコンテンツのみを抽出します
- 広告、ポップアップ、ナビゲーションメニューなどのノイズを排除します
- 不要なHTML/CSSを削除することでトークンの使用量を削減します
- LLM処理を向上させるために一貫したマークダウンフォーマットを提供します
- コンテンツに関する有用なメタデータが含まれています
インストール
Smithery経由でインストール
Smithery経由で Claude Desktop 用の Mozilla Readability Parser を自動的にインストールするには:
手動インストール
ツールリファレンス
parse
Web ページのコンテンツを取得して、クリーンな Markdown に変換します。
引数:
戻り値:
Claude Desktopでの使用
claude_desktop_config.json
に追加します:
依存関係
- @mozilla/readability - コンテンツ抽出
- turndown - HTMLからMarkdownへの変換
- jsdom - DOM解析
- axios - HTTPリクエスト
ライセンス
マサチューセッツ工科大学
You must be authenticated.
Tools
ウェブページのコンテンツを抽出し、LLMに最適化されたクリーンなMarkdown形式に変換します。記事のタイトル、メインコンテンツ、抜粋、署名、サイト名を返します。Mozillaの読みやすさアルゴリズムを使用し、広告、ナビゲーション、フッター、その他の不要な要素を削除しながら、コアコンテンツの構造を維持します。
Appeared in Searches
- Searching for Rizhao Urban Investment's Annual Report and Rating Report for a Due Diligence Report
- Enhancing web access capabilities for Cursor
- Searching for local information or documents
- Methods to Convert Dynamic Web Content to Readable Formats like Markdown, Text, or HTML
- Gathering Information from a Company's Website Root URL