hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Integrations
Utilizes Mozilla's Readability library (the same engine used in Firefox's Reader View) to extract meaningful content from web pages for conversion to Markdown
Converts clean HTML to high-quality Markdown with TurndownService, supporting both web scraping and direct conversion of local HTML files
Leverages Mozilla's Readability library to extract the main content from web pages while removing clutter and navigation elements
ウェブサイトスクレーパー
ウェブサイトをスクレイピングし、HTML を Markdown に変換するためのコマンドライン ツールと MCP サーバー。
特徴
- Mozilla のReadabilityライブラリ (Firefox のリーダー ビューで使用されているのと同じエンジン) を使用して、Web ページから意味のあるコンテンツを抽出します。
- TurndownService を使用して、クリーンな HTML を高品質の Markdown に変換します。
- 潜在的に有害なスクリプトタグを削除してHTMLを安全に処理します
- コマンドラインツールとMCPサーバーの両方として機能します
- ローカル HTML ファイルを Markdown に直接変換できます
インストール
使用法
CLIモード
MCP サーバーモード
このツールは、モデル コンテキスト プロトコル (MCP) サーバーとして使用できます。
コード構造
src/index.ts
- コア機能とMCPサーバーの実装src/cli.ts
- コマンドラインインターフェースの実装src/data_processing.ts
- HTML から Markdown への変換機能
API
このツールは次の機能をエクスポートします。
ライセンス
ISC
This server cannot be installed
Mozilla の Readability エンジンを使用して、Web サイトから意味のあるコンテンツを抽出し、HTML を高品質の Markdown に変換する MCP サーバー。