WebSearch - 高度なWeb検索およびコンテンツ抽出ツール
Python で構築された強力な Web 検索およびコンテンツ抽出ツールで、Firecrawl API を活用して高度な Web スクレイピング、検索、コンテンツ分析機能を実現します。
🚀 機能
高度なウェブ検索: カスタマイズ可能なパラメータを使用してインテリジェントなウェブ検索を実行します
コンテンツ抽出:自然言語プロンプトを使用してWebページから特定の情報を抽出します
Web クロール: 設定可能な深さと制限で Web サイトをクロールします
Webスクレイピング: さまざまな出力形式をサポートしたWebページをスクレイピングします
MCP統合:シームレスな統合を実現するモデルコンテキストプロトコル(MCP)サーバーとして構築
📋 前提条件
Python 3.8以上
UVパッケージマネージャー
Firecrawl APIキー
OpenAI API キー(オプション、拡張機能用)
Tavily API キー(オプション、追加の検索機能用)
🛠️ インストール
uvをインストールします:
リポジトリをクローンします。
uv を使用して仮想環境を作成し、アクティブ化します。
uv を使用して依存関係をインストールします。
環境変数を設定します。
🎯 使用方法
Claude のデスクトップ版の設定
サーバーを直接実行する代わりに、Claude for Desktop が WebSearch ツールにアクセスするように構成できます。
Claude for Desktop 構成ファイルを見つけるか作成します。
Windows:
%env:AppData%\Claude\claude_desktop_config.jsonmacOS:
~/Library/Application Support/Claude/claude_desktop_config.json
WebSearch サーバー構成を
mcpServersセクションに追加します。
ディレクトリ パスを、WebSearch プロジェクト フォルダーへの絶対パスに置き換えてください。
設定ファイルを保存し、Claude for Desktop を再起動します。
設定が完了すると、WebSearch ツールが Claude for Desktop のツール メニュー (ハンマー アイコン) に表示されます。
利用可能なツール
検索
情報抽出
ウェブサイトをクロールする
コンテンツをスクレイピングする
📚 APIリファレンス
検索
query(str): 検索クエリ戻り値: JSON形式の検索結果
抽出する
urls(List[str]): 情報を抽出するURLのリストprompt(str): 抽出の指示enableWebSearch(bool): 補助的なウェブ検索を有効にするshowSources(bool): ソース参照を含める戻り値: 指定された形式で抽出された情報
クロール
url(str): 開始URLmaxDepth(int): 最大クロール深度limit(int): クロールする最大ページ数戻り値: クロールされたコンテンツをマークダウン/HTML形式で返します
削る
url(str): ターゲットURL戻り値: オプションのスクリーンショットを含むスクレイピングされたコンテンツ
🔧 構成
環境変数
このツールが機能するには特定のAPIキーが必要です。テンプレートとして使用できる.env.exampleファイルをご用意しております。
サンプルファイルをコピーします。
API キーを使用して
.envファイルを編集します。
APIキーの取得
OpenAI APIキー:
OpenAIのプラットフォームを訪問する
サインアップまたはログイン
APIキーセクションに移動する
新しい秘密鍵を作成する
Firecrawl APIキー:
Firecrawlのウェブサイトをご覧ください
アカウントを作成する
ダッシュボードに移動する
新しいAPIキーを生成する
すべてが正しく設定されていれば、検索結果を含む JSON 応答が返されます。
トラブルシューティング
エラーが発生した場合:
.envファイルに必要なすべての API キーが設定されていることを確認します。APIキーが有効であり、期限が切れていないことを確認します
.envファイルがプロジェクトのルートディレクトリにあることを確認します。環境変数が正しく読み込まれていることを確認してください
🤝 貢献する
リポジトリをフォークする
機能ブランチを作成します(
git checkout -b feature/AmazingFeature)変更をコミットします(
git commit -m 'Add some AmazingFeature')ブランチにプッシュする (
git push origin feature/AmazingFeature)プルリクエストを開く
📝 ライセンス
このプロジェクトは MIT ライセンスに基づいてライセンスされています - 詳細についてはLICENSEファイルを参照してください。
🙏 謝辞
📬 お問い合わせ
ホセ・マルティン・ロドリゲス・モルタローニ - @m4s1t425 - jmrodriguezm13@gmail.com
PythonとFirecrawlを使って❤️で作りました
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Firecrawl API を使用して高度な Web 検索、コンテンツ抽出、Web クロール、スクレイピング機能を提供する Model Context Protocol (MCP) サーバーとして構築されています。
Related Resources
Related MCP Servers
- Asecurity-licenseAqualityA Model Context Protocol (MCP) server that provides search and crawl functionality using Search1API.Last updated -91157MIT License
- Asecurity-licenseAqualityA Model Context Protocol (MCP) server implementation that integrates with FireCrawl for advanced web scraping capabilities.Last updated -39,2394,746MIT License
- Asecurity-licenseAqualityA Model Context Protocol server that enables web search, scraping, crawling, and content extraction through multiple engines including SearXNG, Firecrawl, and Tavily.Last updated -42857MIT License
- -security-license-qualityA Model Context Protocol server that enables AI assistants to perform advanced web scraping, crawling, searching, and data extraction through the Firecrawl API.Last updated -39,239MIT License
Appeared in Searches
- Web search tools and methods that don't require API keys
- A server for searching research papers, Kaggle datasets, and websites for ML/AI model training data
- iPhone 16e camera review summary and table creation in Italian
- Web scraping and content extraction
- Web scraping tool for extracting content from SearXNG search results