Skip to main content
Glama
askjohngeorge

Doc Scraper MCP Server

ドキュメントスクレーパー MCP サーバー

鍛冶屋のバッジ

ドキュメントスクレイピング機能を提供するModel Context Protocol(MCP)サーバー。このサーバーは、jina.aiの変換サービスを使用して、WebベースのドキュメントをMarkdown形式に変換します。

特徴

  • 任意のWeb URLからドキュメントをスクレイピングします

  • HTMLドキュメントをマークダウン形式に変換します

  • 変換されたドキュメントを指定された出力パスに保存します

  • モデルコンテキストプロトコル(MCP)と統合

Related MCP server: Markdownify MCP Server - UTF-8 Enhanced

インストール

Smithery経由でインストール

Smithery経由で Claude Desktop 用の Doc Scraper を自動的にインストールするには:

npx -y @smithery/cli install @askjohngeorge/mcp-doc-scraper --client claude
  1. リポジトリをクローンします。

git clone https://github.com/askjohngeorge/mcp-doc-scraper.git cd mcp-doc-scraper
  1. 仮想環境を作成してアクティブ化します。

python -m venv venv source venv/bin/activate # On Windows, use: venv\Scripts\activate
  1. 依存関係をインストールします。

pip install -e .

使用法

サーバーは Python を使用して実行できます。

python -m mcp_doc_scraper

ツールの説明

サーバーは次の単一のツールを提供します:

  • 名前: scrape_docs

  • 説明: URLからドキュメントをスクレイピングし、マークダウンとして保存します

  • 入力パラメータ:

    • url : スクレイピングするドキュメントのURL

    • output_path : マークダウンファイルを保存するパス

プロジェクト構造

doc_scraper/ ├── __init__.py ├── __main__.py └── server.py

依存関係

  • aiohttp

  • マクピー

  • ピダンティック

発達

開発環境をセットアップするには:

  1. 開発依存関係をインストールします。

pip install -r requirements.txt
  1. サーバーはモデルコンテキストプロトコル( MCP)を使用します。MCPのドキュメントをよくお読みください。

ライセンス

MITライセンス

-
security - not tested
F
license - not found
-
quality - not tested

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/askjohngeorge/mcp-doc-scraper'

If you have feedback or need assistance with the MCP directory API, please join our Discord server