MCP ディープウェブリサーチサーバー (v0.3.0)
高度な Web 調査のためのモデル コンテキスト プロトコル (MCP) サーバー。
最新の変更点
- ウェブページコンテンツを直接抽出するための visit_page ツールを追加しました
- MCPタイムアウト制限内で動作するように最適化されたパフォーマンス
- デフォルトのmaxDepthとmaxBranchingパラメータを削減
- ページの読み込み効率の向上
- プロセス全体にタイムアウトチェックを追加しました
- タイムアウト時のエラー処理の強化
このプロジェクトは、 mzxraiによるmcp-webresearchのフォークであり、ディープウェブリサーチ機能のための追加機能が強化されています。私たちは、元の作成者たちの基礎的な作業に感謝いたします。
インテリジェントな検索キューイング、強化されたコンテンツ抽出、詳細な調査機能により、Claude にリアルタイムの情報を取り込みます。
特徴
- インテリジェント検索キューシステム
- レート制限付きのバッチ検索操作
- 進捗状況を追跡するキュー管理
- エラー回復と自動再試行
- 検索結果の重複排除
- 強化されたコンテンツ抽出
- TF-IDFベースの関連性スコアリング
- キーワード近接分析
- コンテンツセクションの重み付け
- 読みやすさスコア
- HTML構造解析の改善
- 構造化データ抽出
- コンテンツの整理とフォーマットの改善
- コア機能
- Google検索統合
- ウェブページコンテンツの抽出
- 研究セッションの追跡
- フォーマットが改善されたマークダウン変換
前提条件
- Node.js >= 18 (
npm
とnpx
を含む) - クロードデスクトップアプリ
インストール
グローバルインストール(推奨)
ローカルプロジェクトのインストール
クロードデスクトップ統合
パッケージをインストールした後、 claude_desktop_config.json
に次のエントリを追加します。
ウィンドウズ
場所: %APPDATA%\Claude\claude_desktop_config.json
macOS
場所: ~/Library/Application Support/Claude/claude_desktop_config.json
この設定により、Claude Desktop は必要に応じて Web リサーチ MCP サーバーを自動的に起動できるようになります。
初回セットアップ
インストール後、このコマンドを実行して必要なブラウザ依存関係をインストールします。
使用法
Claude とチャットを開始し、Web リサーチに役立つプロンプトを送信するだけです。より詳細な Web リサーチ向けにカスタマイズされた既成のプロンプトが必要な場合は、このパッケージで提供されているagentic-research
プロンプトをご利用ください。Claude Desktop でこのプロンプトにアクセスするには、チャット入力欄のペーパークリップアイコンをクリックし、 Choose an integration
→ deepwebresearch
→ agentic-research
を選択します。
ツール
deep_research
- コンテンツ分析による包括的な調査を実施
- 引数:
- 戻り値:
parallel_search
- インテリジェントなキューイングで複数の Google 検索を並行して実行します
- 引数:
{ queries: string[], maxParallel?: number }
- 注: 信頼性の高いパフォーマンスを確保するために、maxParallel は 5 に制限されています。
visit_page
- ウェブページにアクセスしてコンテンツを抽出する
- 引数:
{ url: string }
- 戻り値:
プロンプト
agentic-research
クロードが徹底的なウェブリサーチを行うのに役立つガイド付きリサーチプロンプト。このプロンプトは、クロードに以下の指示を与えます。
- トピックの状況を理解するために、まずは広範囲な検索から始めましょう
- 高品質で信頼できる情報源を優先する
- 調査結果に基づいて研究の方向性を繰り返し改善する
- 情報を提供し、インタラクティブに研究を進めることができます
- 常にURLでソースを引用する
設定オプション
サーバーは環境変数を通じて設定できます:
MAX_PARALLEL_SEARCHES
: 同時検索の最大数(デフォルト: 5)SEARCH_DELAY_MS
: 検索間の遅延(ミリ秒単位)(デフォルト: 200)MAX_RETRIES
: 失敗したリクエストの再試行回数(デフォルト: 3)TIMEOUT_MS
: リクエストタイムアウト(ミリ秒)(デフォルト: 55000)LOG_LEVEL
: ログレベル(デフォルト: 'info')
エラー処理
よくある問題
- レート制限
- 症状: 「リクエストが多すぎます」というエラー
- 解決策:
SEARCH_DELAY_MS
を増やすか、MAX_PARALLEL_SEARCHES
を減らす
- ネットワークタイムアウト
- 症状: 「リクエストがタイムアウトしました」というエラー
- 解決策: リクエストが60秒のMCPタイムアウト内に完了することを確認する
- ブラウザの問題
- 症状: 「ブラウザの起動に失敗しました」というエラー
- 解決策: Playwright が正しくインストールされていることを確認してください (
npx playwright install
)
デバッグ
これはベータ版ソフトウェアです。問題が発生した場合は、以下の手順に従ってください。
- Claude Desktop の MCP ログを確認します。
- デバッグ ログを有効にする:
発達
設定
テスト
コード品質
貢献
- リポジトリをフォークする
- 機能ブランチを作成します(
git checkout -b feature/amazing-feature
) - 変更をコミットします (
git commit -m 'Add some amazing feature'
) - ブランチにプッシュする (
git push origin feature/amazing-feature
) - プルリクエストを開く
コーディング標準
- TypeScriptのベストプラクティスに従う
- テストカバレッジを80%以上維持する
- 新しい機能とAPIを文書化する
- 重要な変更についてはCHANGELOG.mdを更新してください
- セマンティックバージョニングに従う
パフォーマンスに関する考慮事項
- 可能な場合はバッチ操作を使用する
- 適切なエラー処理と再試行を実装する
- 大規模なデータセットでのメモリ使用量を考慮する
- 適切な場合に結果をキャッシュする
- 大容量コンテンツにはストリーミングを使用する
要件
- Node.js >= 18
- Playwright (依存関係として自動的にインストールされます)
検証済みプラットフォーム
- [x] macOS
- [x] ウィンドウズ
- [ ] リナックス
ライセンス
マサチューセッツ工科大学
クレジット
このプロジェクトは、 mzxraiによるmcp-webresearchの優れた成果を基盤としています。オリジナルのコードベースは、私たちの強化された機能と性能の基盤となりました。
著者
You must be authenticated.
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
MCP Web Research Server は、Google 検索を統合し、Web ページのコンテンツとスクリーンショットをキャプチャし、調査セッションを追跡することで、Claude によるリアルタイムの Web 調査を可能にします。
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server for web research. Bring real-time info into Claude and easily research any topic.Last updated -3854189JavaScriptMIT License
Kagi MCP Serverofficial
AsecurityAlicenseAqualityAn MCP server that integrates Kagi search capabilities with Claude AI, enabling Claude to perform real-time web searches when answering questions that require up-to-date information.Last updated -193PythonMIT License- -securityAlicense-qualityA Model Context Protocol server that enables Claude to perform web research by integrating Google search, extracting webpage content, and capturing screenshots in real-time.Last updated -8541JavaScriptMIT License
- -securityAlicense-qualityA server that integrates with Claude Desktop to enable real-time web research capabilities, allowing users to search Google, extract webpage content, and capture screenshots directly from conversations.Last updated -854MIT License