ドキュメントスクレーパー MCP サーバー
ドキュメントスクレイピング機能を提供するModel Context Protocol(MCP)サーバー。このサーバーは、jina.aiの変換サービスを使用して、WebベースのドキュメントをMarkdown形式に変換します。
特徴
任意のWeb URLからドキュメントをスクレイピングします
HTMLドキュメントをマークダウン形式に変換します
変換されたドキュメントを指定された出力パスに保存します
モデルコンテキストプロトコル(MCP)と統合
Related MCP server: Markdownify MCP Server - UTF-8 Enhanced
インストール
Smithery経由でインストール
Smithery経由で Claude Desktop 用の Doc Scraper を自動的にインストールするには:
リポジトリをクローンします。
仮想環境を作成してアクティブ化します。
依存関係をインストールします。
使用法
サーバーは Python を使用して実行できます。
ツールの説明
サーバーは次の単一のツールを提供します:
名前:
scrape_docs説明: URLからドキュメントをスクレイピングし、マークダウンとして保存します
入力パラメータ:
url: スクレイピングするドキュメントのURLoutput_path: マークダウンファイルを保存するパス
プロジェクト構造
依存関係
aiohttp
マクピー
ピダンティック
発達
開発環境をセットアップするには:
開発依存関係をインストールします。
サーバーはモデルコンテキストプロトコル( MCP)を使用します。MCPのドキュメントをよくお読みください。
ライセンス
MITライセンス