フェッチャーMCP

Playwright ヘッドレスブラウザを使用して Web ページコンテンツを取得するための MCP サーバー。

利点

JavaScript サポート: 従来の Web スクレーパーとは異なり、Fetcher MCP は Playwright を使用して JavaScript を実行するため、動的な Web コンテンツや最新の Web アプリケーションを処理できます。
インテリジェントなコンテンツ抽出: 組み込みの読みやすさアルゴリズムにより、Web ページから主要なコンテンツが自動的に抽出され、広告、ナビゲーション、その他の不要な要素が削除されます。
柔軟な出力形式: HTML と Markdown の両方の出力形式をサポートしているため、さまざまな下流アプリケーションと簡単に統合できます。
並列処理: fetch_urlsツールを使用すると、複数の URL を同時に取得できるため、バッチ操作の効率が大幅に向上します。
リソースの最適化: 不要なリソース (画像、スタイルシート、フォント、メディア) を自動的にブロックして、帯域幅の使用量を削減し、パフォーマンスを向上させます。
堅牢なエラー処理: 包括的なエラー処理とログ記録により、問題のある Web ページを処理する場合でも信頼性の高い操作が保証されます。
構成可能なパラメータ: さまざまなユースケースに合わせて、タイムアウト、コンテンツの抽出、出力フォーマットを細かく制御します。

Related MCP server: MCP Server Fetch Python

クイックスタート

npx で直接実行します:

npx -y fetcher-mcp

初回セットアップ - ターミナルで次のコマンドを実行して、必要なブラウザをインストールします。

npx playwright install chromium

デバッグモード

--debugオプションをつけて実行すると、デバッグ用のブラウザウィンドウが表示されます。

npx -y fetcher-mcp --debug

構成MCP

Claude Desktop でこの MCP サーバーを構成します。

MacOSの場合: ~/Library/Application Support/Claude/claude_desktop_config.json

Windows の場合: %APPDATA%/Claude/claude_desktop_config.json

{ "mcpServers": { "fetcher": { "command": "npx", "args": ["-y", "fetcher-mcp"] } } }

特徴

fetch_url - 指定された URL から Web ページのコンテンツを取得します
- Playwrightヘッドレスブラウザを使用してJavaScriptを解析します
- メインコンテンツのインテリジェントな抽出とMarkdownへの変換をサポート
- 次のパラメータをサポートします:
  - url : 取得するウェブページのURL（必須パラメータ）
  - timeout : ページ読み込みのタイムアウト（ミリ秒単位）。デフォルトは 30000（30 秒）
  - waitUntil : ナビゲーションが完了したとみなすタイミングを指定します。オプション: 'load'、'domcontentloaded'、'networkidle'、'commit'、デフォルトは 'load'
  - extractContent : メインコンテンツをインテリジェントに抽出するかどうか。デフォルトは true
  - maxLength : 返されるコンテンツの最大長（文字数）。デフォルトでは制限なし
  - returnHtml : Markdownの代わりにHTMLコンテンツを返すかどうか。デフォルトはfalse
  - waitForNavigation : 最初のページ読み込み後に追加のナビゲーションを待機するかどうか（アンチボット検証のあるサイトで便利）、デフォルトは false
  - navigationTimeout : 追加のナビゲーションを待機する最大時間（ミリ秒単位）。デフォルトは 10000（10 秒）です。
  - disableMedia : メディアリソース（画像、スタイルシート、フォント、メディア）を無効にするかどうか。デフォルトは true
  - debug : デバッグモードを有効にするかどうか（ブラウザウィンドウを表示する）。指定されている場合、--debug コマンドラインフラグを上書きします。
fetch_urls - 複数の URL から Web ページのコンテンツを並列に一括取得します
- マルチタブ並列フェッチを使用してパフォーマンスを向上
- ウェブページ間の明確な区別とともに統合された結果を返します
- 次のパラメータをサポートします:
  - urls : 取得するURLの配列（必須パラメータ）
  - その他のパラメータはfetch_urlと同じです

ヒント

特殊なウェブサイトシナリオの取り扱い

アンチクローラー機構への対処

読み込みが完了するまで待機: CAPTCHA、リダイレクト、またはその他の検証メカニズムを使用する Web サイトの場合は、プロンプトに次の内容を含めます。
Please wait for the page to fully load
これにはwaitForNavigation: trueパラメータが使用されます。
タイムアウト期間を延長する: 読み込みが遅いウェブサイトの場合:
Please set the page loading timeout to 60 seconds
これにより、 timeoutとnavigationTimeout両方のパラメータがそれに応じて調整されます。

コンテンツ取得調整

元の HTML 構造を保持: コンテンツの抽出が失敗する可能性がある場合:
Please preserve the original HTML content
extractContent: falseおよびreturnHtml: true設定します。
完全なページコンテンツを取得: 抽出されたコンテンツが制限されすぎている場合:
Please fetch the complete webpage content instead of just the main content
extractContent: falseを設定します。
コンテンツを HTML として返す: デフォルトの Markdown ではなく HTML 形式が必要な場合:
Please return the content in HTML format
returnHtml: trueを設定します。

デバッグと認証

デバッグモードを有効にする

動的デバッグのアクティブ化: 特定のフェッチ操作中にブラウザウィンドウを表示するには:
Please enable debug mode for this fetch operation
これにより、サーバーが--debugフラグなしで起動された場合でもdebug: trueが設定されます。

認証にカスタムCookieを使用する

手動ログイン: 自分の資格情報を使用してログインするには:
Please run in debug mode so I can manually log in to the website
debug: trueを設定するか、 --debugフラグを使用して、手動ログイン用にブラウザウィンドウを開いたままにします。
デバッグブラウザとの対話: デバッグモードが有効な場合:
1. ブラウザウィンドウは開いたままです
2. 資格情報を使用して手動でウェブサイトにログインできます
3. ログインが完了すると、認証されたセッションでコンテンツが取得されます
特定のリクエストに対してデバッグを有効にする: サーバーがすでに実行されている場合でも、特定のリクエストに対してデバッグモードを有効にすることができます。
Please enable debug mode for this authentication step
この特定のリクエストに対してのみdebug: trueを設定し、手動ログイン用のブラウザウィンドウを開きます。

発達

依存関係をインストールする

npm install

Playwrightブラウザをインストールする

Playwright に必要なブラウザをインストールします。

npm run install-browser

サーバーを構築する

npm run build

デバッグ

デバッグには MCP Inspector を使用します。

npm run inspector

デバッグ用にブラウザ表示モードを有効にすることもできます。

node build/index.js --debug

ライセンス

MITライセンスに基づいてライセンスされています

Fetch MCP

フェッチャーMCP

利点

クイックスタート

デバッグモード

構成MCP

特徴

ヒント

特殊なウェブサイトシナリオの取り扱い

アンチクローラー機構への対処

コンテンツ取得調整

デバッグと認証

デバッグモードを有効にする

認証にカスタムCookieを使用する

発達

依存関係をインストールする

Playwrightブラウザをインストールする

サーバーを構築する

デバッグ

関連プロジェクト

ライセンス

Resources

Tools

Appeared in Searches

New MCP Servers

Latest Blog Posts

MCP directory API