ウェブサイトスクレーパー
ウェブサイトをスクレイピングし、HTML を Markdown に変換するためのコマンドライン ツールと MCP サーバー。
特徴
Mozilla のReadabilityライブラリ (Firefox のリーダー ビューで使用されているのと同じエンジン) を使用して、Web ページから意味のあるコンテンツを抽出します。
TurndownService を使用して、クリーンな HTML を高品質の Markdown に変換します。
潜在的に有害なスクリプトタグを削除してHTMLを安全に処理します
コマンドラインツールとMCPサーバーの両方として機能します
ローカル HTML ファイルを Markdown に直接変換できます
インストール
使用法
CLIモード
MCP サーバーモード
このツールは、モデル コンテキスト プロトコル (MCP) サーバーとして使用できます。
コード構造
src/index.ts- コア機能とMCPサーバーの実装src/cli.ts- コマンドラインインターフェースの実装src/data_processing.ts- HTML から Markdown への変換機能
API
このツールは次の機能をエクスポートします。
ライセンス
ISC
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Tools
Mozilla の Readability エンジンを使用して、Web サイトから意味のあるコンテンツを抽出し、HTML を高品質の Markdown に変換する MCP サーバー。
Related MCP Servers
- Asecurity-licenseAqualityA powerful MCP server for fetching and transforming web content into various formats (HTML, JSON, Markdown, Plain Text) with ease.Last updated -41,01737MIT License
- Asecurity-licenseAqualityAn MCP server for fetching and transforming web content into various formats.Last updated -47MIT License
- Asecurity-licenseAqualityMCP server that converts Markdown to high-quality PDF documents using LaTeX, enabling AI agents like Claude to generate professional PDFs without requiring sign-ups or credit cards.Last updated -1247MIT License
- Asecurity-licenseAqualityAn MCP server that converts Markdown to HTML, supporting both stdio and HTTP interfaces for easy integration with Cursor and other MCP clients.Last updated -14