Scraper.is MCP Server

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Integrations

  • Allows scraping and extracting structured data from Amazon's product listings, including filtering by price and star ratings

  • Enables extracting article titles, authors, and content from TechCrunch's website and specific category pages

  • Facilitates collection of user reviews from company pages on Trustpilot, with ability to navigate through multiple pages

Scraper.is MCP

Scraper.isモデル コンテキスト プロトコル (MCP)統合 - AI アシスタント用の強力な Web スクレイピング ツール。

このパッケージにより、AI アシスタントは MCP プロトコルを通じて Web コンテンツをスクレイピングし、Web から最新の情報にアクセスできるようになります。

特徴

  • 🌐 Webスクレイピング:あらゆるウェブサイトからコンテンツを抽出
  • 📸スクリーンショット: Webページの視覚的な表現をキャプチャします
  • 📄複数のフォーマット: マークダウン、HTML、JSON でコンテンツを取得
  • 🔄進捗状況の更新:スクレイピング操作中のリアルタイムの進捗状況レポート
  • 🔌 MCP統合:MCP対応のAIアシスタントとのシームレスな統合

インストール

npm install -g scraperis-mcp

または糸で:

yarn global add scraperis-mcp

前提条件

このパッケージを使用するには、Scraper.is API キーが必要です。

APIキーの取得

  1. scraper.isでサインアップまたはログインしてください
  2. ダッシュボードの API キーセクションに移動します: https://www.scraper.is/dashboard/apikeys
  3. 新しいAPIキーを作成するか、既存のキーをコピーします
  4. このパッケージを使用するにはこのキーが必要なので、安全に保管してください。

使用法

環境設定

Scraper.is API キーを使用して.envファイルを作成します。

SCRAPERIS_API_KEY=your_api_key_here

クロードデスクトップ統合

このパッケージをClaude Desktopで使用するには:

  1. パッケージをグローバルにインストールします。
    npm install -g scraperis-mcp
  2. claude_desktop_config.jsonファイルに次の構成を追加します。
    { "mcpServers": { "scraperis_scraper": { "command": "scraperis-mcp", "args": [], "env": { "SCRAPERIS_API_KEY": "your-api-key-here", "DEBUG": "*" } } } }
  3. your-api-key-here実際の Scraper.is API キーに置き換えます。
  4. 変更を適用するには、Claude Desktop を再起動します。

MCP Inspectorで実行

開発とテストには、MCP Inspector を使用できます。

npx @modelcontextprotocol/inspector scraperis-mcp

AIアシスタントとの統合

このパッケージは、モデルコンテキストプロトコル(MCP)をサポートするAIアシスタントで使用するために設計されています。適切に設定すると、AIアシスタントは以下のツールを使用できるようになります。

スクレイプツール

scrapeツールを使用すると、AIはウェブサイトからコンテンツを抽出できます。様々な形式をサポートしています。

  • markdown : コンテンツをマークダウン形式で返します
  • html : コンテンツをHTML形式で返します
  • screenshot : ウェブページのスクリーンショットを返します
  • json : JSON形式で構造化データを返します

AI のプロンプトの例:

Can you scrape the latest news from techcrunch.com and summarize it for me?

APIリファレンス

ツール

削る

プロンプトに基づいて Web ページからコンテンツをスクレイピングします。

パラメータ:

  • prompt (文字列): スクレイピングする内容を説明するプロンプト(URLを含む)
  • format (文字列): コンテンツを返す形式 ( markdownhtmlscreenshotjsonquick )

例:

{ "prompt": "Get me the top 10 products from producthunt.com", "format": "markdown" }

発達

設定

  1. リポジトリをクローンします。
    git clone https://github.com/Ai-Quill/scraperis-mcp.git cd scraperis-mcp
  2. 依存関係をインストールします:
    npm install
  3. プロジェクトをビルドします。
    npm run build

スクリプト

  • npm run build : プロジェクトをビルドする
  • npm run watch : 変更を監視して再構築する
  • npm run dev : 開発用にMCP Inspectorで実行
  • npm run test : テストを実行する
  • npm run lint : ESLint を実行する

貢献

貢献を歓迎します!お気軽にプルリクエストを送信してください。

ライセンス

このプロジェクトは MIT ライセンスに基づいてライセンスされています - 詳細については LICENSE ファイルを参照してください。

謝辞

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

自然言語プロンプトを使用して Web サイトからデータを抽出できるため、ユーザーは必要なコンテンツを平易な英語で正確に指定し、構造化された JSON データを返すことができます。

  1. Features
    1. Installation
      1. Prerequisites
        1. Getting Your API Key
      2. Usage
        1. Environment Setup
        2. Claude Desktop Integration
        3. Running with MCP Inspector
        4. Integration with AI Assistants
      3. API Reference
        1. Tools
      4. Development
        1. Setup
        2. Scripts
      5. Contributing
        1. License
          1. Acknowledgements
            ID: gnbnl8d941