Mozilla 読みやすさパーサー MCP サーバー
ウェブページのコンテンツを抽出し、LLMに最適化されたクリーンなMarkdownに変換するモデルコンテキストプロトコル(MCP)サーバーです。記事のタイトル、メインコンテンツ、抜粋、署名、サイト名を返します。Mozillaの読みやすさアルゴリズムを使用し、広告、ナビゲーション、フッター、その他の不要な要素を削除しながら、コアコンテンツの構造を維持します。MCPの詳細はこちら。
特徴
広告、ナビゲーション、フッター、その他の不要なコンテンツを削除します
クリーンな HTML をフォーマットされた Markdown に変換します (Turndown も使用)
記事のメタデータ(タイトル、抜粋、署名、サイト名)を返します
エラーを適切に処理する
Related MCP server: Skrape MCP Server
ただフェッチするだけではダメですか?
単純なフェッチ要求とは異なり、このサーバーは次の処理を行います。
Mozilla の読みやすさアルゴリズムを使用して、関連するコンテンツのみを抽出します
広告、ポップアップ、ナビゲーションメニューなどのノイズを排除します
不要なHTML/CSSを削除することでトークンの使用量を削減します
LLM処理を向上させるために一貫したマークダウンフォーマットを提供します
コンテンツに関する有用なメタデータが含まれています
インストール
Smithery経由でインストール
Smithery経由で Claude Desktop 用の Mozilla Readability Parser を自動的にインストールするには:
npx -y @smithery/cli install server-moz-readability --client claude手動インストール
npm install server-moz-readabilityツールリファレンス
parse
Web ページのコンテンツを取得して、クリーンな Markdown に変換します。
引数:
{
"url": {
"type": "string",
"description": "The website URL to parse",
"required": true
}
}戻り値:
{
"title": "Article title",
"content": "Markdown content...",
"metadata": {
"excerpt": "Brief summary",
"byline": "Author information",
"siteName": "Source website name"
}
}Claude Desktopでの使用
claude_desktop_config.jsonに追加します:
{
"mcpServers": {
"readability": {
"command": "npx",
"args": ["-y", "server-moz-readability"]
}
}
}依存関係
@mozilla/readability - コンテンツ抽出
turndown - HTMLからMarkdownへの変換
jsdom - DOM解析
axios - HTTPリクエスト
ライセンス
マサチューセッツ工科大学