Skip to main content
Glama

Mozilla Readability Parser MCP Server

by jmh108
MIT License
1
  • Linux
  • Apple

MCP サーバー可読性パーサー (Python / FastMCP)

クレジット/参考文献

このプロジェクトは、 emzimmerのオリジナルのserver-moz-readability実装に基づいています。(オリジナルの README ドキュメントについては、オリジナルの README.mdを参照してください。)

このPython実装は、 FastMCPを使用してPythonベースのMCPとして実行するためのオリジナルのコンセプトを採用しています。

Mozilla 読みやすさパーサー MCP サーバー

Web ページのコンテンツを抽出し、クリーンで LLM に最適化された Markdown に変換するModel Context Protocol (MCP)サーバーの Python 実装です。

目次

特徴

  • 広告、ナビゲーション、フッター、その他の不要なコンテンツを削除します
  • クリーンなHTMLをフォーマットされたMarkdownに変換します
  • エラーを適切に処理する
  • LLM処理に最適化
  • 軽量で高速

ただフェッチするだけではダメですか?

単純なフェッチ要求とは異なり、このサーバーは次の処理を行います。

  • 読みやすさアルゴリズムを使用して関連コンテンツのみを抽出します
  • 広告、ポップアップ、ナビゲーションメニューなどのノイズを排除します
  • 不要なHTML/CSSを削除することでトークンの使用量を削減します
  • LLM処理を向上させるために一貫したマークダウンフォーマットを提供します
  • 動的なコンテンツを含む複雑なWebページを処理

インストール

  1. リポジトリをクローンします。
git clone https://github.com/jmh108/MCP-server-readability-python.git cd MCP-server-readability-python
  1. 仮想環境を作成してアクティブ化します。
python -m venv venv source venv/bin/activate # On Windows use: venv\Scripts\activate
  1. 依存関係をインストールします:
pip install -r requirements.txt

クイックスタート

  1. サーバーを起動します。
fastmcp run server.py
  1. リクエストの例:
curl -X POST http://localhost:8000/tools/extract_content \ -H "Content-Type: application/json" \ -d '{"url": "https://example.com/article"}'

ツールリファレンス

extract_content

Web ページのコンテンツを取得して、クリーンな Markdown に変換します。

引数:

{ "url": { "type": "string", "description": "The website URL to parse", "required": true } }

戻り値:

{ "content": "Markdown content..." }

MCP サーバーの構成

MCP サーバーを構成するには、MCP 設定ファイルに次の行を追加します。

{ "mcpServers": { "readability": { "command": "fastmcp", "args": ["run", "server.py"], "env": {} } } }

その後、MCP プロトコルを使用してサーバーを起動し、 parseツールを介してアクセスできるようになります。

依存関係

ライセンス

MIT ライセンス - 詳細についてはライセンスを参照してください。

-
security - not tested
A
license - permissive license
-
quality - not tested

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Web ページのコンテンツを抽出し、広告や不要な要素を削除して、クリーンで LLM に最適化された Markdown に変換する MCP サーバーの Python 実装。

  1. クレジット/参考文献
    1. Mozilla 読みやすさパーサー MCP サーバー
      1. 目次
      2. 特徴
      3. ただフェッチするだけではダメですか?
      4. インストール
      5. クイックスタート
      6. ツールリファレンス
      7. MCP サーバーの構成
      8. 依存関係
      9. ライセンス

    Related MCP Servers

    • A
      security
      A
      license
      A
      quality
      A powerful MCP server for fetching and transforming web content into various formats (HTML, JSON, Markdown, Plain Text) with ease.
      Last updated -
      4
      146
      12
      TypeScript
      MIT License
      • Apple
      • Linux
    • -
      security
      A
      license
      -
      quality
      A Python-based MCP server that crawls websites to extract and save content as markdown files, with features for mapping website structure and links.
      Last updated -
      1
      Python
      MIT License
    • A
      security
      A
      license
      A
      quality
      An MCP server that retrieves web page content using Playwright headless browser, capable of extracting main content and converting to Markdown format.
      Last updated -
      2
      651
      727
      TypeScript
      MIT License
      • Apple
    • -
      security
      F
      license
      -
      quality
      An MCP server that extracts meaningful content from websites and converts HTML to high-quality Markdown, using Mozilla's Readability engine.
      Last updated -
      11,993
      2
      JavaScript

    View all related MCP servers

    MCP directory API

    We provide all the information about MCP servers via our MCP API.

    curl -X GET 'https://glama.ai/api/mcp/v1/servers/jmh108/MCP-server-readability-python'

    If you have feedback or need assistance with the MCP directory API, please join our Discord server