
ドキュメントスクレーパー MCP サーバー
ドキュメントスクレイピング機能を提供するModel Context Protocol(MCP)サーバー。このサーバーは、jina.aiの変換サービスを使用して、WebベースのドキュメントをMarkdown形式に変換します。
特徴
任意のWeb URLからドキュメントをスクレイピングします
HTMLドキュメントをマークダウン形式に変換します
変換されたドキュメントを指定された出力パスに保存します
モデルコンテキストプロトコル(MCP)と統合
インストール
Smithery経由でインストール
Smithery経由で Claude Desktop 用の Doc Scraper を自動的にインストールするには:
リポジトリをクローンします。
仮想環境を作成してアクティブ化します。
依存関係をインストールします。
使用法
サーバーは Python を使用して実行できます。
ツールの説明
サーバーは次の単一のツールを提供します:
名前:
scrape_docs説明: URLからドキュメントをスクレイピングし、マークダウンとして保存します
入力パラメータ:
url: スクレイピングするドキュメントのURLoutput_path: マークダウンファイルを保存するパス
プロジェクト構造
依存関係
aiohttp
マクピー
ピダンティック
発達
開発環境をセットアップするには:
開発依存関係をインストールします。
サーバーはモデルコンテキストプロトコル( MCP)を使用します。MCPのドキュメントをよくお読みください。
ライセンス
MITライセンス
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
jina.ai の変換サービスを使用して Web ベースのドキュメントをマークダウン形式に変換し、ユーザーが任意の URL からドキュメントをスクレイピングしてマークダウン ファイルとして保存できるようにします。
Related Resources
Related MCP Servers
- Asecurity-licenseAqualityConverts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.Last updated -1072,163MIT License
 - Asecurity-licenseAqualityA document conversion server that transforms various file formats (PDFs, documents, images, audio, web content) to Markdown with improved multilingual and UTF-8 support.Last updated -10110MIT License
 - Asecurity-licenseAqualityA server that converts various file formats (PDF, images, Office documents, etc.) to Markdown descriptions using Cloudflare AI services.Last updated -1434
 - Asecurity-licenseAqualityFast, token-efficient web content extraction tool that converts websites to clean Markdown for AI agents, featuring smart caching, content extraction with Mozilla Readability, and polite crawling capabilities.Last updated -114891MIT License