Skip to main content
Glama

Doc Scraper MCP Server

ドキュメントスクレーパー MCP サーバー

ドキュメントスクレイピング機能を提供するModel Context Protocol(MCP)サーバー。このサーバーは、jina.aiの変換サービスを使用して、WebベースのドキュメントをMarkdown形式に変換します。

特徴

  • 任意のWeb URLからドキュメントをスクレイピングします
  • HTMLドキュメントをマークダウン形式に変換します
  • 変換されたドキュメントを指定された出力パスに保存します
  • モデルコンテキストプロトコル(MCP)と統合

インストール

Smithery経由でインストール

Smithery経由で Claude Desktop 用の Doc Scraper を自動的にインストールするには:

npx -y @smithery/cli install @askjohngeorge/mcp-doc-scraper --client claude
  1. リポジトリをクローンします。
git clone https://github.com/askjohngeorge/mcp-doc-scraper.git cd mcp-doc-scraper
  1. 仮想環境を作成してアクティブ化します。
python -m venv venv source venv/bin/activate # On Windows, use: venv\Scripts\activate
  1. 依存関係をインストールします。
pip install -e .

使用法

サーバーは Python を使用して実行できます。

python -m mcp_doc_scraper

ツールの説明

サーバーは次の単一のツールを提供します:

  • 名前: scrape_docs
  • 説明: URLからドキュメントをスクレイピングし、マークダウンとして保存します
  • 入力パラメータ:
    • url : スクレイピングするドキュメントのURL
    • output_path : マークダウンファイルを保存するパス

プロジェクト構造

doc_scraper/ ├── __init__.py ├── __main__.py └── server.py

依存関係

  • aiohttp
  • マクピー
  • ピダンティック

発達

開発環境をセットアップするには:

  1. 開発依存関係をインストールします。
pip install -r requirements.txt
  1. サーバーはモデルコンテキストプロトコル( MCP)を使用します。MCPのドキュメントをよくお読みください。

ライセンス

MITライセンス

-
security - not tested
F
license - not found
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

jina.ai の変換サービスを使用して Web ベースのドキュメントをマークダウン形式に変換し、ユーザーが任意の URL からドキュメントをスクレイピングしてマークダウン ファイルとして保存できるようにします。

  1. 特徴
    1. インストール
      1. Smithery経由でインストール
    2. 使用法
      1. ツールの説明
    3. プロジェクト構造
      1. 依存関係
        1. 発達
          1. ライセンス

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              Integrates Jina.ai's Reader API with LLMs for efficient and structured web content extraction, optimized for documentation and web content analysis.
              Last updated -
              1
              24
              24
              JavaScript
              MIT License
              • Linux
            • A
              security
              A
              license
              A
              quality
              Converts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.
              Last updated -
              10
              2
              1,611
              TypeScript
              MIT License
              • Apple
            • A
              security
              A
              license
              A
              quality
              Converts various file formats to Markdown using the MarkItDown utility and can be integrated with MCP clients for seamless document processing and conversion.
              Last updated -
              26
              Python
              MIT License
            • A
              security
              A
              license
              A
              quality
              An MCP server that enables users to download webpages as markdown files using r.jina.ai service, with features for configurable download directories and automatic date-stamped filenames.
              Last updated -
              5
              2
              25
              JavaScript
              MIT License
              • Linux
              • Apple

            View all related MCP servers

            MCP directory API

            We provide all the information about MCP servers via our MCP API.

            curl -X GET 'https://glama.ai/api/mcp/v1/servers/askjohngeorge/mcp-doc-scraper'

            If you have feedback or need assistance with the MCP directory API, please join our Discord server