Skip to main content
Glama

MCP Deep Web Research Server

MCP ディープウェブリサーチサーバー (v0.3.0)

Node.js バージョン タイプスクリプト ライセンス: MIT 鍛冶屋のバッジ

高度な Web 調査のためのモデル コンテキスト プロトコル (MCP) サーバー。

最新の変更点

  • ウェブページコンテンツを直接抽出するための visit_page ツールを追加しました

  • MCPタイムアウト制限内で動作するように最適化されたパフォーマンス

    • デフォルトのmaxDepthとmaxBranchingパラメータを削減

    • ページの読み込み効率の向上

    • プロセス全体にタイムアウトチェックを追加しました

    • タイムアウト時のエラー処理の強化

このプロジェクトは、 mzxraiによるmcp-webresearchのフォークであり、ディープウェブリサーチ機能のための追加機能が強化されています。私たちは、元の作成者たちの基礎的な作業に感謝いたします。

インテリジェントな検索キューイング、強化されたコンテンツ抽出、詳細な調査機能により、Claude にリアルタイムの情報を取り込みます。

特徴

  • インテリジェント検索キューシステム

    • レート制限付きのバッチ検索操作

    • 進捗状況を追跡するキュー管理

    • エラー回復と自動再試行

    • 検索結果の重複排除

  • 強化されたコンテンツ抽出

    • TF-IDFベースの関連性スコアリング

    • キーワード近接分析

    • コンテンツセクションの重み付け

    • 読みやすさスコア

    • HTML構造解析の改善

    • 構造化データ抽出

    • コンテンツの整理とフォーマットの改善

  • コア機能

    • Google検索統合

    • ウェブページコンテンツの抽出

    • 研究セッションの追跡

    • フォーマットが改善されたマークダウン変換

前提条件

インストール

Smithery経由でインストール

Smithery経由で Claude Desktop 用の Deep Web Research Server を自動的にインストールするには:

npx -y @smithery/cli install @PedroDnT/mcp-deepwebresearch --client claude

グローバルインストール(推奨)

# Install globally using npm npm install -g mcp-deepwebresearch # Or using yarn yarn global add mcp-deepwebresearch # Or using pnpm pnpm add -g mcp-deepwebresearch

ローカルプロジェクトのインストール

# Using npm npm install mcp-deepwebresearch # Using yarn yarn add mcp-deepwebresearch # Using pnpm pnpm add mcp-deepwebresearch

クロードデスクトップ統合

パッケージをインストールした後、 claude_desktop_config.jsonに次のエントリを追加します。

ウィンドウズ

{ "mcpServers": { "deepwebresearch": { "command": "mcp-deepwebresearch", "args": [] } } }

場所: %APPDATA%\Claude\claude_desktop_config.json

macOS

{ "mcpServers": { "deepwebresearch": { "command": "mcp-deepwebresearch", "args": [] } } }

場所: ~/Library/Application Support/Claude/claude_desktop_config.json

この設定により、Claude Desktop は必要に応じて Web リサーチ MCP サーバーを自動的に起動できるようになります。

初回セットアップ

インストール後、このコマンドを実行して必要なブラウザ依存関係をインストールします。

npx playwright install chromium

使用法

Claude とチャットを開始し、Web リサーチに役立つプロンプトを送信するだけです。より詳細な Web リサーチ向けにカスタマイズされた既成のプロンプトが必要な場合は、このパッケージで提供されているagentic-researchプロンプトをご利用ください。Claude Desktop でこのプロンプトにアクセスするには、チャット入力欄のペーパークリップアイコンをクリックし、 Choose an integrationdeepwebresearchagentic-researchを選択します。

ツール

  1. deep_research

    • コンテンツ分析による包括的な調査を実施

    • 引数:

      { topic: string; maxDepth?: number; // default: 2 maxBranching?: number; // default: 3 timeout?: number; // default: 55000 (55 seconds) minRelevanceScore?: number; // default: 0.7 }
    • 戻り値:

      { findings: { mainTopics: Array<{name: string, importance: number}>; keyInsights: Array<{text: string, confidence: number}>; sources: Array<{url: string, credibilityScore: number}>; }; progress: { completedSteps: number; totalSteps: number; processedUrls: number; }; timing: { started: string; completed?: string; duration?: number; operations?: { parallelSearch?: number; deduplication?: number; topResultsProcessing?: number; remainingResultsProcessing?: number; total?: number; }; }; }
  2. parallel_search

    • インテリジェントなキューイングで複数の Google 検索を並行して実行します

    • 引数: { queries: string[], maxParallel?: number }

    • 注: 信頼性の高いパフォーマンスを確保するために、maxParallel は 5 に制限されています。

  3. visit_page

    • ウェブページにアクセスしてコンテンツを抽出する

    • 引数: { url: string }

    • 戻り値:

      { url: string; title: string; content: string; // Markdown formatted content }

プロンプト

agentic-research

クロードが徹底的なウェブ調査を行うのに役立つガイド付きリサーチプロンプト。このプロンプトは、クロードに以下の指示を与えます。

  • トピックの状況を理解するために、まずは広範囲な検索から始めましょう

  • 高品質で信頼できる情報源を優先する

  • 調査結果に基づいて研究の方向性を繰り返し改善する

  • 情報を提供し、インタラクティブに研究を進めることができます

  • 常にURLでソースを引用する

設定オプション

サーバーは環境変数を通じて設定できます:

  • MAX_PARALLEL_SEARCHES : 同時検索の最大数(デフォルト: 5)

  • SEARCH_DELAY_MS : 検索間の遅延(ミリ秒単位)(デフォルト: 200)

  • MAX_RETRIES : 失敗したリクエストの再試行回数(デフォルト: 3)

  • TIMEOUT_MS : リクエストタイムアウト(ミリ秒)(デフォルト: 55000)

  • LOG_LEVEL : ログレベル(デフォルト: 'info')

エラー処理

よくある問題

  1. レート制限

    • 症状: 「リクエストが多すぎます」というエラー

    • 解決策: SEARCH_DELAY_MSを増やすか、 MAX_PARALLEL_SEARCHESを減らす

  2. ネットワークタイムアウト

    • 症状: 「リクエストがタイムアウトしました」というエラー

    • 解決策: リクエストが60秒のMCPタイムアウト内に完了することを確認する

  3. ブラウザの問題

    • 症状: 「ブラウザの起動に失敗しました」というエラー

    • 解決策: Playwright が正しくインストールされていることを確認してください ( npx playwright install )

デバッグ

これはベータ版ソフトウェアです。問題が発生した場合は、以下の手順に従ってください。

  1. Claude Desktop の MCP ログを確認します。

    # On macOS tail -n 20 -f ~/Library/Logs/Claude/mcp*.log # On Windows Get-Content -Path "$env:APPDATA\Claude\logs\mcp*.log" -Tail 20 -Wait
  2. デバッグ ログを有効にする:

    export LOG_LEVEL=debug

発達

設定

# Install dependencies pnpm install # Build the project pnpm build # Watch for changes pnpm watch # Run in development mode pnpm dev

テスト

# Run all tests pnpm test # Run tests in watch mode pnpm test:watch # Run tests with coverage pnpm test:coverage

コード品質

# Run linter pnpm lint # Fix linting issues pnpm lint:fix # Type check pnpm type-check

貢献

  1. リポジトリをフォークする

  2. 機能ブランチを作成します( git checkout -b feature/amazing-feature

  3. 変更をコミットします ( git commit -m 'Add some amazing feature' )

  4. ブランチにプッシュする ( git push origin feature/amazing-feature )

  5. プルリクエストを開く

コーディング標準

  • TypeScriptのベストプラクティスに従う

  • テストカバレッジを80%以上維持する

  • 新しい機能とAPIを文書化する

  • 重要な変更についてはCHANGELOG.mdを更新してください

  • セマンティックバージョニングに従う

パフォーマンスに関する考慮事項

  • 可能な場合はバッチ操作を使用する

  • 適切なエラー処理と再試行を実装する

  • 大規模なデータセットでのメモリ使用量を考慮する

  • 適切な場合に結果をキャッシュする

  • 大容量コンテンツにはストリーミングを使用する

要件

  • Node.js >= 18

  • Playwright (依存関係として自動的にインストールされます)

検証済みプラットフォーム

  • [x] macOS

  • [x] ウィンドウズ

  • [ ] リナックス

ライセンス

マサチューセッツ工科大学

クレジット

このプロジェクトは、 mzxraiによるmcp-webresearchの優れた成果を基盤としています。オリジナルのコードベースは、私たちの強化された機能と性能の基盤となりました。

著者

qpd-v

Deploy Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Related MCP Servers

  • A
    security
    A
    license
    A
    quality
    A Model Context Protocol (MCP) server for web research. Bring real-time info into Claude and easily research any topic.
    Last updated -
    3
    274
    285
    MIT License
    • Apple
  • A
    security
    A
    license
    A
    quality
    A Model Context Protocol server that provides DuckDuckGo search functionality for Claude, enabling web search capabilities through a clean tool interface with rate limiting support.
    Last updated -
    22
    1
    212
    66
    MIT License
    • Apple
  • A
    security
    A
    license
    A
    quality
    A Model Context Protocol server that enables Claude to perform web research by integrating Google search, extracting webpage content, and capturing screenshots.
    Last updated -
    3
    274
    17
    MIT License
    • Apple
  • A
    security
    A
    license
    A
    quality
    A Model Context Protocol server that enables Claude to perform web research by integrating Google search, extracting webpage content, and capturing screenshots in real-time.
    Last updated -
    4
    274
    7
    MIT License
    • Apple
    • Linux

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/PedroDnT/mcp-DEEPwebresearch'

If you have feedback or need assistance with the MCP directory API, please join our Discord server