Skip to main content
Glama
robot-resources

Robot Resources Scraper

npm version License: MIT

@robot-resources/scraper-mcp

⚠️ 非推奨 — @robot-resources/scraper に統合されました。 このMCPサーバーは、メインのスクレイパーパッケージ内の組み込み scraper-mcp バイナリとして提供されるようになりました。1つのパッケージをインストールするだけでMCPが利用可能です。npx robot-resources --for=cursor または npx robot-resources --for=claude-code で自動設定できます。以下のツール(scraper_compress_urlscraper_crawl_url)およびパラメータに変更はありません。

Scraper用MCPサーバー — AIエージェントのためのコンテキスト圧縮。

Robot Resourcesとは?

AIエージェントのための「人事部(Human Resources)」です。

Robot Resourcesは、AIエージェントに2つのスーパーパワーを与えます:

  • ルーター — 各LLM呼び出しを、最も安価で有能なモデルにルーティングします。OpenAI、Anthropic、Google全体で60〜90%のコスト削減を実現します。

  • スクレイパー — WebページをクリーンなMarkdownに圧縮します。ページあたりのトークン数を70〜80%削減します。

どちらもローカルで実行されます。APIキーがマシンから外部へ送信されることはありません。無料、無制限、ティア制限なし。

フルスイートのインストール

npx robot-resources

1つのコマンドですべてがセットアップされます。詳細は robotresources.ai をご覧ください。


このMCPサーバーについて

このパッケージは、Model Context Protocol を介してWebコンテンツをトークン効率の良いMarkdownに圧縮するための2つのツール(シングルページ圧縮とマルチページBFSクロール)をAIエージェントに提供します。

インストール

npx @robot-resources/scraper-mcp

またはグローバルにインストール:

npm install -g @robot-resources/scraper-mcp

Claude Desktopの設定

claude_desktop_config.json に以下を追加します:

{
  "mcpServers": {
    "scraper": {
      "command": "npx",
      "args": ["-y", "@robot-resources/scraper-mcp"]
    }
  }
}

ツール

scraper_compress_url

単一のWebページを70〜90%少ないトークンのMarkdownに圧縮します。

パラメータ:

パラメータ

必須

デフォルト

説明

url

string

はい

圧縮するURL

mode

string

いいえ

'auto'

'fast', 'stealth', 'render', または 'auto'

timeout

number

いいえ

10000

フェッチのタイムアウト(ミリ秒)

maxRetries

number

いいえ

3

最大リトライ回数 (0-10)

プロンプト例: "Compress https://docs.example.com/getting-started"

scraper_crawl_url

BFSリンク探索を使用して、開始URLから複数のページをクロールします。

パラメータ:

パラメータ

必須

デフォルト

説明

url

string

はい

クロールを開始するURL

maxPages

number

いいえ

10

クロールする最大ページ数 (1-100)

maxDepth

number

いいえ

2

最大リンク深度 (0-5)

mode

string

いいえ

'auto'

'fast', 'stealth', 'render', または 'auto'

include

string[]

いいえ

含めるURLパターン (glob)

exclude

string[]

いいえ

除外するURLパターン (glob)

timeout

number

いいえ

10000

ページごとのタイムアウト(ミリ秒)

プロンプト例: "Crawl the docs at https://docs.example.com with max 20 pages"

フェッチモード

モード

方法

使用シーン

'fast'

通常のHTTP

標準的なサイト、API、ドキュメント

'stealth'

TLSフィンガープリント偽装

ボット対策が施されたサイト

'render'

ヘッドレスブラウザ (Playwright)

JSでレンダリングされるSPA

'auto'

高速 → 403/チャレンジ時にstealthへフォールバック

不明なサイト(デフォルト)

Stealthには impit が、renderには playwright@robot-resources/scraper のピア依存関係として必要です。

要件

  • Node.js 18以上

関連プロジェクト

ライセンス

MIT

Install Server
A
license - permissive license
B
quality
F
maintenance

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/robot-resources/scraper-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server