MCP Firecrawl サーバー
これは、Firecrawl の API を使用して Web サイトをスクレイピングし、構造化データを抽出するためのツールを提供するシンプルな MCP サーバーです。
設定
- 依存関係をインストールします:
- 次の変数を含む
.env
ファイルをルート ディレクトリに作成します。
FIRECRAWL_API_TOKEN
(必須): Firecrawl APIトークンSENTRY_DSN
(オプション): エラー追跡とパフォーマンス監視用の Sentry DSN
- サーバーを起動します。
あるいは、サーバーの実行時に環境変数を直接設定することもできます。
特徴
- ウェブサイトスクレイピング:さまざまな形式でウェブサイトからコンテンツを抽出します
- 構造化データ抽出:カスタムスキーマに基づいて特定のデータポイントを抽出します
- エラー追跡: エラー追跡とパフォーマンス監視のために Sentry と統合されています
使用法
サーバーは 2 つのツールを公開します。
scrape-website
: 複数のフォーマットオプションを備えた基本的なウェブサイトスクレイピングextract-data
: プロンプトとスキーマに基づく構造化データ抽出
ツール: scrape-website
このツールは、Web サイトをスクレイピングし、要求された形式でそのコンテンツを返します。
パラメータ:
url
(文字列、必須): スクレイピングするウェブサイトのURLformats
(文字列の配列、オプション): 希望する出力形式の配列。サポートされている形式は以下のとおりです。"markdown"
(デフォルト)"html"
"text"
MCP Inspector の使用例:
ツール: データ抽出
このツールは、提供されたプロンプトとスキーマに基づいて、Web サイトから構造化データを抽出します。
パラメータ:
urls
(文字列の配列、必須): データを抽出するURLの配列prompt
(文字列、必須):抽出するデータを説明するプロンプトschema
(オブジェクト、必須): 抽出するデータのスキーマ定義
スキーマ定義は、キーがフィールド名、値が型であるオブジェクトである必要があります。サポートされる型は次のとおりです。
"string"
: テキストフィールドの場合"boolean"
: true/falseフィールド用"number"
: 数値フィールドの場合- 配列:
["type"]
として指定されます。type は上記のいずれかです。 - オブジェクト: 独自の型定義を持つネストされたオブジェクト
MCP Inspector の使用例:
どちらのツールも、スクレイピングまたは抽出が失敗した場合に適切なエラー メッセージを返し、設定されている場合は自動的に Sentry にエラーを記録します。
トラブルシューティング
問題が発生した場合:
- Firecrawl APIトークンが有効であることを確認してください
- スクレイピングしようとしているURLにアクセスできることを確認してください
- 複雑なスキーマの場合は、サポートされている形式に従っていることを確認してください。
- Sentry ログで詳細なエラー情報を確認する (構成されている場合)
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Firecrawl の API を使用して Web サイトをスクレイピングし、そこから構造化データを抽出するためのツールを提供するサーバー。複数の形式での基本的な Web サイト スクレイピングと、カスタム スキーマ ベースのデータ抽出の両方をサポートします。
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server implementation that integrates with FireCrawl for advanced web scraping capabilities.Last updated -921,7173,668JavaScriptMIT License
- AsecurityAlicenseAqualityA server that provides web scraping and intelligent content searching capabilities using the Firecrawl API, enabling AI agents to extract structured data from websites and perform content searches.Last updated -52TypeScriptMIT License
- -securityAlicense-qualityA Model Context Protocol server that enables AI assistants to perform advanced web scraping, crawling, searching, and data extraction through the Firecrawl API.Last updated -21,717MIT License
Oxylabs MCP Serverofficial
AsecurityAlicenseAqualityA scraper tool that leverages the Oxylabs Web Scraper API to fetch and process web content with flexible options for parsing and rendering pages, enabling efficient content extraction from complex websites.Last updated -233PythonMIT License