Skip to main content
Glama
PedroDnT

MCP Deep Web Research Server

MCP ディープウェブリサーチサーバー (v0.3.0)

Node.js バージョン タイプスクリプト ライセンス: MIT 鍛冶屋のバッジ

高度な Web 調査のためのモデル コンテキスト プロトコル (MCP) サーバー。

最新の変更点

  • ウェブページコンテンツを直接抽出するための visit_page ツールを追加しました

  • MCPタイムアウト制限内で動作するように最適化されたパフォーマンス

    • デフォルトのmaxDepthとmaxBranchingパラメータを削減

    • ページの読み込み効率の向上

    • プロセス全体にタイムアウトチェックを追加しました

    • タイムアウト時のエラー処理の強化

このプロジェクトは、 mzxraiによるmcp-webresearchのフォークであり、ディープウェブリサーチ機能のための追加機能が強化されています。私たちは、元の作成者たちの基礎的な作業に感謝いたします。

インテリジェントな検索キューイング、強化されたコンテンツ抽出、詳細な調査機能により、Claude にリアルタイムの情報を取り込みます。

Related MCP server: DuckDuckGo MCP Server

特徴

  • インテリジェント検索キューシステム

    • レート制限付きのバッチ検索操作

    • 進捗状況を追跡するキュー管理

    • エラー回復と自動再試行

    • 検索結果の重複排除

  • 強化されたコンテンツ抽出

    • TF-IDFベースの関連性スコアリング

    • キーワード近接分析

    • コンテンツセクションの重み付け

    • 読みやすさスコア

    • HTML構造解析の改善

    • 構造化データ抽出

    • コンテンツの整理とフォーマットの改善

  • コア機能

    • Google検索統合

    • ウェブページコンテンツの抽出

    • 研究セッションの追跡

    • フォーマットが改善されたマークダウン変換

前提条件

インストール

Smithery経由でインストール

Smithery経由で Claude Desktop 用の Deep Web Research Server を自動的にインストールするには:

npx -y @smithery/cli install @PedroDnT/mcp-deepwebresearch --client claude

グローバルインストール(推奨)

# Install globally using npm
npm install -g mcp-deepwebresearch

# Or using yarn
yarn global add mcp-deepwebresearch

# Or using pnpm
pnpm add -g mcp-deepwebresearch

ローカルプロジェクトのインストール

# Using npm
npm install mcp-deepwebresearch

# Using yarn
yarn add mcp-deepwebresearch

# Using pnpm
pnpm add mcp-deepwebresearch

クロードデスクトップ統合

パッケージをインストールした後、 claude_desktop_config.jsonに次のエントリを追加します。

ウィンドウズ

{
  "mcpServers": {
    "deepwebresearch": {
      "command": "mcp-deepwebresearch",
      "args": []
    }
  }
}

場所: %APPDATA%\Claude\claude_desktop_config.json

macOS

{
  "mcpServers": {
    "deepwebresearch": {
      "command": "mcp-deepwebresearch",
      "args": []
    }
  }
}

場所: ~/Library/Application Support/Claude/claude_desktop_config.json

この設定により、Claude Desktop は必要に応じて Web リサーチ MCP サーバーを自動的に起動できるようになります。

初回セットアップ

インストール後、このコマンドを実行して必要なブラウザ依存関係をインストールします。

npx playwright install chromium

使用法

Claude とチャットを開始し、Web リサーチに役立つプロンプトを送信するだけです。より詳細な Web リサーチ向けにカスタマイズされた既成のプロンプトが必要な場合は、このパッケージで提供されているagentic-researchプロンプトをご利用ください。Claude Desktop でこのプロンプトにアクセスするには、チャット入力欄のペーパークリップアイコンをクリックし、 Choose an integrationdeepwebresearchagentic-researchを選択します。

ツール

  1. deep_research

    • コンテンツ分析による包括的な調査を実施

    • 引数:

      {
        topic: string;
        maxDepth?: number;      // default: 2
        maxBranching?: number;  // default: 3
        timeout?: number;       // default: 55000 (55 seconds)
        minRelevanceScore?: number;  // default: 0.7
      }
    • 戻り値:

      {
        findings: {
          mainTopics: Array<{name: string, importance: number}>;
          keyInsights: Array<{text: string, confidence: number}>;
          sources: Array<{url: string, credibilityScore: number}>;
        };
        progress: {
          completedSteps: number;
          totalSteps: number;
          processedUrls: number;
        };
        timing: {
          started: string;
          completed?: string;
          duration?: number;
          operations?: {
            parallelSearch?: number;
            deduplication?: number;
            topResultsProcessing?: number;
            remainingResultsProcessing?: number;
            total?: number;
          };
        };
      }
  2. parallel_search

    • インテリジェントなキューイングで複数の Google 検索を並行して実行します

    • 引数: { queries: string[], maxParallel?: number }

    • 注: 信頼性の高いパフォーマンスを確保するために、maxParallel は 5 に制限されています。

  3. visit_page

    • ウェブページにアクセスしてコンテンツを抽出する

    • 引数: { url: string }

    • 戻り値:

      {
        url: string;
        title: string;
        content: string;  // Markdown formatted content
      }

プロンプト

agentic-research

クロードが徹底的なウェブ調査を行うのに役立つガイド付きリサーチプロンプト。このプロンプトは、クロードに以下の指示を与えます。

  • トピックの状況を理解するために、まずは広範囲な検索から始めましょう

  • 高品質で信頼できる情報源を優先する

  • 調査結果に基づいて研究の方向性を繰り返し改善する

  • 情報を提供し、インタラクティブに研究を進めることができます

  • 常にURLでソースを引用する

設定オプション

サーバーは環境変数を通じて設定できます:

  • MAX_PARALLEL_SEARCHES : 同時検索の最大数(デフォルト: 5)

  • SEARCH_DELAY_MS : 検索間の遅延(ミリ秒単位)(デフォルト: 200)

  • MAX_RETRIES : 失敗したリクエストの再試行回数(デフォルト: 3)

  • TIMEOUT_MS : リクエストタイムアウト(ミリ秒)(デフォルト: 55000)

  • LOG_LEVEL : ログレベル(デフォルト: 'info')

エラー処理

よくある問題

  1. レート制限

    • 症状: 「リクエストが多すぎます」というエラー

    • 解決策: SEARCH_DELAY_MSを増やすか、 MAX_PARALLEL_SEARCHESを減らす

  2. ネットワークタイムアウト

    • 症状: 「リクエストがタイムアウトしました」というエラー

    • 解決策: リクエストが60秒のMCPタイムアウト内に完了することを確認する

  3. ブラウザの問題

    • 症状: 「ブラウザの起動に失敗しました」というエラー

    • 解決策: Playwright が正しくインストールされていることを確認してください ( npx playwright install )

デバッグ

これはベータ版ソフトウェアです。問題が発生した場合は、以下の手順に従ってください。

  1. Claude Desktop の MCP ログを確認します。

    # On macOS
    tail -n 20 -f ~/Library/Logs/Claude/mcp*.log
    
    # On Windows
    Get-Content -Path "$env:APPDATA\Claude\logs\mcp*.log" -Tail 20 -Wait
  2. デバッグ ログを有効にする:

    export LOG_LEVEL=debug

発達

設定

# Install dependencies
pnpm install

# Build the project
pnpm build

# Watch for changes
pnpm watch

# Run in development mode
pnpm dev

テスト

# Run all tests
pnpm test

# Run tests in watch mode
pnpm test:watch

# Run tests with coverage
pnpm test:coverage

コード品質

# Run linter
pnpm lint

# Fix linting issues
pnpm lint:fix

# Type check
pnpm type-check

貢献

  1. リポジトリをフォークする

  2. 機能ブランチを作成します( git checkout -b feature/amazing-feature

  3. 変更をコミットします ( git commit -m 'Add some amazing feature' )

  4. ブランチにプッシュする ( git push origin feature/amazing-feature )

  5. プルリクエストを開く

コーディング標準

  • TypeScriptのベストプラクティスに従う

  • テストカバレッジを80%以上維持する

  • 新しい機能とAPIを文書化する

  • 重要な変更についてはCHANGELOG.mdを更新してください

  • セマンティックバージョニングに従う

パフォーマンスに関する考慮事項

  • 可能な場合はバッチ操作を使用する

  • 適切なエラー処理と再試行を実装する

  • 大規模なデータセットでのメモリ使用量を考慮する

  • 適切な場合に結果をキャッシュする

  • 大容量コンテンツにはストリーミングを使用する

要件

  • Node.js >= 18

  • Playwright (依存関係として自動的にインストールされます)

検証済みプラットフォーム

  • [x] macOS

  • [x] ウィンドウズ

  • [ ] リナックス

ライセンス

マサチューセッツ工科大学

クレジット

このプロジェクトは、 mzxraiによるmcp-webresearchの優れた成果を基盤としています。オリジナルのコードベースは、私たちの強化された機能と性能の基盤となりました。

著者

qpd-v

Install Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/PedroDnT/mcp-DEEPwebresearch'

If you have feedback or need assistance with the MCP directory API, please join our Discord server