A
securityA
licenseA
qualityA Model Context Protocol (MCP) server implementation that integrates with FireCrawl for advanced web scraping capabilities.
Last updated -
9
16,506
3,053
JavaScript
MIT License
这是一个简单的 MCP 服务器,它提供使用 Firecrawl 的 API 来抓取网站和提取结构化数据的工具。
.env
文件,其中包含以下变量:FIRECRAWL_API_TOKEN
(必需):您的 Firecrawl API 令牌SENTRY_DSN
(可选):用于错误跟踪和性能监控的 Sentry DSN或者,您可以在运行服务器时直接设置环境变量:
该服务器公开了两个工具:
scrape-website
:具有多种格式选项的基本网站抓取extract-data
:基于提示和模式的结构化数据提取该工具抓取网站并以请求的格式返回其内容。
参数:
url
(字符串,必需):要抓取的网站的 URLformats
(字符串数组,可选):所需输出格式的数组。支持的格式包括:"markdown"
(默认)"html"
"text"
MCP Inspector 的使用示例:
该工具根据提供的提示和模式从网站提取结构化数据。
参数:
urls
(字符串数组,必需):从中提取数据的 URL 数组prompt
(字符串,必需):描述要提取什么数据的提示schema
(对象,必需):要提取的数据的模式定义模式定义应该是一个对象,其中键是字段名称,值是类型。支持的类型包括:
"string"
:用于文本字段"boolean"
:用于真/假字段"number"
:用于数字字段["type"]
其中 type 是上述之一MCP Inspector 的使用示例:
如果抓取或提取失败,这两种工具都会返回适当的错误消息,并且如果配置的话,会自动将错误记录到 Sentry。
如果您遇到问题:
You must be authenticated.
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
该服务器提供使用 Firecrawl 的 API 抓取网站并从中提取结构化数据的工具,支持多种格式的基本网站抓取和基于自定义模式的数据提取。
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/codyde/mcp-firecrawl-tool'
If you have feedback or need assistance with the MCP directory API, please join our Discord server