Mozilla Readability Parser MCP Server

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Integrations

  • Converts clean HTML from web pages into well-formatted Markdown, optimizing content for LLM processing with consistent formatting.

  • Leverages Mozilla's Readability algorithm to extract and transform webpage content into clean, LLM-optimized Markdown by removing ads, navigation, footers and other non-essential content.

MCP サーバー可読性パーサー (Python / FastMCP)

クレジット/参考文献

このプロジェクトは、 emzimmerのオリジナルのserver-moz-readability実装に基づいています。(オリジナルの README ドキュメントについては、オリジナルの README.mdを参照してください。)

このPython実装は、 FastMCPを使用してPythonベースのMCPとして実行するためのオリジナルのコンセプトを採用しています。

Mozilla 読みやすさパーサー MCP サーバー

Web ページのコンテンツを抽出し、クリーンで LLM に最適化された Markdown に変換するModel Context Protocol (MCP)サーバーの Python 実装です。

目次

特徴

  • 広告、ナビゲーション、フッター、その他の不要なコンテンツを削除します
  • クリーンなHTMLをフォーマットされたMarkdownに変換します
  • エラーを適切に処理する
  • LLM処理に最適化
  • 軽量で高速

ただフェッチするだけではダメですか?

単純なフェッチ要求とは異なり、このサーバーは次の処理を行います。

  • 読みやすさアルゴリズムを使用して関連コンテンツのみを抽出します
  • 広告、ポップアップ、ナビゲーションメニューなどのノイズを排除します
  • 不要なHTML/CSSを削除することでトークンの使用量を削減します
  • LLM処理を向上させるために一貫したマークダウンフォーマットを提供します
  • 動的なコンテンツを含む複雑なWebページを処理

インストール

  1. リポジトリをクローンします。
git clone https://github.com/jmh108/MCP-server-readability-python.git cd MCP-server-readability-python
  1. 仮想環境を作成してアクティブ化します。
python -m venv venv source venv/bin/activate # On Windows use: venv\Scripts\activate
  1. 依存関係をインストールします:
pip install -r requirements.txt

クイックスタート

  1. サーバーを起動します。
fastmcp run server.py
  1. リクエストの例:
curl -X POST http://localhost:8000/tools/extract_content \ -H "Content-Type: application/json" \ -d '{"url": "https://example.com/article"}'

ツールリファレンス

extract_content

Web ページのコンテンツを取得して、クリーンな Markdown に変換します。

引数:

{ "url": { "type": "string", "description": "The website URL to parse", "required": true } }

戻り値:

{ "content": "Markdown content..." }

MCP サーバーの構成

MCP サーバーを構成するには、MCP 設定ファイルに次の行を追加します。

{ "mcpServers": { "readability": { "command": "fastmcp", "args": ["run", "server.py"], "env": {} } } }

その後、MCP プロトコルを使用してサーバーを起動し、 parseツールを介してアクセスできるようになります。

依存関係

ライセンス

MIT ライセンス - 詳細についてはライセンスを参照してください。

-
security - not tested
A
license - permissive license
-
quality - not tested

Web ページのコンテンツを抽出し、広告や不要な要素を削除して、クリーンで LLM に最適化された Markdown に変換する MCP サーバーの Python 実装。

  1. Credits/Reference
    1. Mozilla Readability Parser MCP Server
      1. Table of Contents
      2. Features
      3. Why Not Just Fetch?
      4. Installation
      5. Quick Start
      6. Tool Reference
      7. MCP Server Configuration
      8. Dependencies
      9. License
    ID: tx69i8e0nq