Robot Resources Scraper
@robot-resources/scraper-mcp
⚠️ 非推奨 —
@robot-resources/scraperに統合されました。 このMCPサーバーは、メインのスクレイパーパッケージ内の組み込みscraper-mcpバイナリとして提供されるようになりました。1つのパッケージをインストールするだけでMCPが利用可能です。npx robot-resources --for=cursorまたはnpx robot-resources --for=claude-codeで自動設定できます。以下のツール(scraper_compress_url、scraper_crawl_url)およびパラメータに変更はありません。
Scraper用MCPサーバー — AIエージェントのためのコンテキスト圧縮。
Robot Resourcesとは?
AIエージェントのための「人事部(Human Resources)」です。
Robot Resourcesは、AIエージェントに2つのスーパーパワーを与えます:
ルーター — 各LLM呼び出しを、最も安価で有能なモデルにルーティングします。OpenAI、Anthropic、Google全体で60〜90%のコスト削減を実現します。
スクレイパー — WebページをクリーンなMarkdownに圧縮します。ページあたりのトークン数を70〜80%削減します。
どちらもローカルで実行されます。APIキーがマシンから外部へ送信されることはありません。無料、無制限、ティア制限なし。
フルスイートのインストール
npx robot-resources1つのコマンドですべてがセットアップされます。詳細は robotresources.ai をご覧ください。
このMCPサーバーについて
このパッケージは、Model Context Protocol を介してWebコンテンツをトークン効率の良いMarkdownに圧縮するための2つのツール(シングルページ圧縮とマルチページBFSクロール)をAIエージェントに提供します。
インストール
npx @robot-resources/scraper-mcpまたはグローバルにインストール:
npm install -g @robot-resources/scraper-mcpClaude Desktopの設定
claude_desktop_config.json に以下を追加します:
{
"mcpServers": {
"scraper": {
"command": "npx",
"args": ["-y", "@robot-resources/scraper-mcp"]
}
}
}ツール
scraper_compress_url
単一のWebページを70〜90%少ないトークンのMarkdownに圧縮します。
パラメータ:
パラメータ | 型 | 必須 | デフォルト | 説明 |
| string | はい | — | 圧縮するURL |
| string | いいえ |
|
|
| number | いいえ |
| フェッチのタイムアウト(ミリ秒) |
| number | いいえ |
| 最大リトライ回数 (0-10) |
プロンプト例: "Compress https://docs.example.com/getting-started"
scraper_crawl_url
BFSリンク探索を使用して、開始URLから複数のページをクロールします。
パラメータ:
パラメータ | 型 | 必須 | デフォルト | 説明 |
| string | はい | — | クロールを開始するURL |
| number | いいえ |
| クロールする最大ページ数 (1-100) |
| number | いいえ |
| 最大リンク深度 (0-5) |
| string | いいえ |
|
|
| string[] | いいえ | — | 含めるURLパターン (glob) |
| string[] | いいえ | — | 除外するURLパターン (glob) |
| number | いいえ |
| ページごとのタイムアウト(ミリ秒) |
プロンプト例: "Crawl the docs at https://docs.example.com with max 20 pages"
フェッチモード
モード | 方法 | 使用シーン |
| 通常のHTTP | 標準的なサイト、API、ドキュメント |
| TLSフィンガープリント偽装 | ボット対策が施されたサイト |
| ヘッドレスブラウザ (Playwright) | JSでレンダリングされるSPA |
| 高速 → 403/チャレンジ時にstealthへフォールバック | 不明なサイト(デフォルト) |
Stealthには impit が、renderには playwright が @robot-resources/scraper のピア依存関係として必要です。
要件
Node.js 18以上
関連プロジェクト
@robot-resources/scraper - コア圧縮ライブラリ
@robot-resources/router-mcp - LLMコスト最適化用MCPサーバー
Robot Resources - AIエージェントのための人事部
ライセンス
MIT
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/robot-resources/scraper-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server