MCP Firecrawl サーバー
これは、Firecrawl の API を使用して Web サイトをスクレイピングし、構造化データを抽出するためのツールを提供するシンプルな MCP サーバーです。
設定
依存関係をインストールします:
次の変数を含む
.envファイルをルート ディレクトリに作成します。
FIRECRAWL_API_TOKEN(必須): Firecrawl APIトークンSENTRY_DSN(オプション): エラー追跡とパフォーマンス監視用の Sentry DSN
サーバーを起動します。
あるいは、サーバーの実行時に環境変数を直接設定することもできます。
Related MCP server: MCP Server Firecrawl
特徴
ウェブサイトスクレイピング:さまざまな形式でウェブサイトからコンテンツを抽出します
構造化データ抽出:カスタムスキーマに基づいて特定のデータポイントを抽出します
エラー追跡: エラー追跡とパフォーマンス監視のために Sentry と統合されています
使用法
サーバーは 2 つのツールを公開します。
scrape-website: 複数のフォーマットオプションを備えた基本的なウェブサイトスクレイピングextract-data: プロンプトとスキーマに基づく構造化データ抽出
ツール: scrape-website
このツールは、Web サイトをスクレイピングし、要求された形式でそのコンテンツを返します。
パラメータ:
url(文字列、必須): スクレイピングするウェブサイトのURLformats(文字列の配列、オプション): 希望する出力形式の配列。サポートされている形式は以下のとおりです。"markdown"(デフォルト)"html""text"
MCP Inspector の使用例:
ツール: データ抽出
このツールは、提供されたプロンプトとスキーマに基づいて、Web サイトから構造化データを抽出します。
パラメータ:
urls(文字列の配列、必須): データを抽出するURLの配列prompt(文字列、必須):抽出するデータを説明するプロンプトschema(オブジェクト、必須): 抽出するデータのスキーマ定義
スキーマ定義は、キーがフィールド名、値が型であるオブジェクトである必要があります。サポートされる型は次のとおりです。
"string": テキストフィールドの場合"boolean": true/falseフィールド用"number": 数値フィールドの場合配列:
["type"]として指定されます。type は上記のいずれかです。オブジェクト: 独自の型定義を持つネストされたオブジェクト
MCP Inspector の使用例:
どちらのツールも、スクレイピングまたは抽出が失敗した場合に適切なエラー メッセージを返し、設定されている場合は自動的に Sentry にエラーを記録します。
トラブルシューティング
問題が発生した場合:
Firecrawl APIトークンが有効であることを確認してください
スクレイピングしようとしているURLにアクセスできることを確認してください
複雑なスキーマの場合は、サポートされている形式に従っていることを確認してください。
Sentry ログで詳細なエラー情報を確認する (構成されている場合)