网络搜索 | Glama

WebSearch - 高级网页搜索和内容提取工具

Python 版本紫外线

使用 Python 构建的强大的网络搜索和内容提取工具，利用 Firecrawl API 实现高级网络抓取、搜索和内容分析功能。

🚀 功能

高级网页搜索：使用可自定义的参数执行智能网页搜索
内容提取：使用自然语言提示从网页中提取特定信息
网络爬取：爬取具有可配置深度和限制的网站
网页抓取：抓取网页，支持多种输出格式
MCP 集成：构建为模型上下文协议 (MCP) 服务器，实现无缝集成

📋 先决条件

Python 3.8 或更高版本
uv 包管理器
Firecrawl API 密钥
OpenAI API 密钥（可选，用于增强功能）
Tavily API 密钥（可选，用于附加搜索功能）

🛠️ 安装

安装 uv：

# On Windows (using pip)
pip install uv

# On Unix/MacOS
curl -LsSf https://astral.sh/uv/install.sh | sh

# Add uv to PATH (Unix/MacOS)
export PATH="$HOME/.local/bin:$PATH"

# Add uv to PATH (Windows - add to Environment Variables)
# Add: %USERPROFILE%\.local\bin

克隆存储库：

git clone https://github.com/yourusername/websearch.git
cd websearch

使用 uv 创建并激活虚拟环境：

# Create virtual environment
uv venv

# Activate on Windows
.\.venv\Scripts\activate.ps1

# Activate on Unix/MacOS
source .venv/bin/activate

使用 uv 安装依赖项：

# Install from requirements.txt
uv sync

设置环境变量：

# Create .env file
touch .env

# Add your API keys
FIRECRAWL_API_KEY=your_firecrawl_api_key
OPENAI_API_KEY=your_openai_api_key

🎯 使用方法

使用 Claude 桌面版进行设置

您无需直接运行服务器，而是可以配置 Claude for Desktop 来访问 WebSearch 工具：

找到或创建您的 Claude for Desktop 配置文件：
- Windows： %env:AppData%\Claude\claude_desktop_config.json
- macOS： ~/Library/Application Support/Claude/claude_desktop_config.json
将 WebSearch 服务器配置添加到mcpServers部分：

{
  "mcpServers": {
    "websearch": {
      "command": "uv",
      "args": [
        "--directory",
        "D:\\ABSOLUTE\\PATH\\TO\\WebSearch",
        "run",
        "main.py"
      ]
    }
  }
}

确保将目录路径替换为 WebSearch 项目文件夹的绝对路径。
保存配置文件并重新启动 Claude for Desktop。
配置完成后，WebSearch 工具将出现在 Claude for Desktop 的工具菜单（锤子图标）中。

可用工具

搜索
提取信息
抓取网站
抓取内容

📚 API 参考

搜索

query （str）：搜索查询
返回：JSON格式的搜索结果

提炼

urls (List[str])：从中提取信息的 URL 列表
prompt (str): 提取说明
enableWebSearch (bool): 启用补充网页搜索
showSources （bool）：包含源引用
返回：以指定格式提取的信息

爬行

url (str): 起始 URL
maxDepth （int）：最大爬行深度
limit （int）：抓取的最大页面数
返回：以 markdown/HTML 格式抓取的内容

刮

url （str）：目标 URL
返回：带有可选屏幕截图的抓取内容

🔧 配置

环境变量

该工具需要特定的 API 密钥才能运行。我们提供了一个.env.example文件，您可以将其用作模板：

复制示例文件：

# On Unix/MacOS
cp .env.example .env

# On Windows
copy .env.example .env

使用您的 API 密钥编辑.env文件：

# OpenAI API key - Required for AI-powered features
OPENAI_API_KEY=your_openai_api_key_here

# Firecrawl API key - Required for web scraping and searching
FIRECRAWL_API_KEY=your_firecrawl_api_key_here

获取 API 密钥

OpenAI API密钥：
- 访问OpenAI 平台
- 注册或登录
- 导航至 API 密钥部分
- 创建新的密钥
Firecrawl API密钥：
- 访问Firecrawl 的网站
- 创建一个帐户
- 导航到您的仪表板
- 生成新的 API 密钥

如果一切配置正确，您应该会收到包含搜索结果的 JSON 响应。

故障排除

如果遇到错误：

确保所有必需的 API 密钥都已在.env文件中设置
验证 API 密钥是否有效且未过期
检查.env文件是否位于项目的根目录中
确保环境变量正确加载

🤝 贡献

分叉存储库
创建你的功能分支（ git checkout -b feature/AmazingFeature ）
提交您的更改（ git commit -m 'Add some AmazingFeature' ）
推送到分支（ git push origin feature/AmazingFeature ）
打开拉取请求

📝 许可证

该项目根据 MIT 许可证获得许可 - 有关详细信息，请参阅LICENSE文件。

🙏 致谢

Firecrawl提供强大的网页抓取 API
OpenAI的 AI 功能
MCP协议规范的 MCP 社区

📬 联系方式

何塞·马丁·罗德里格斯·莫塔洛尼 - @m4s1t425 - jmrodriguezm13@gmail.com

使用 Python 和 Firecrawl 用 ❤️ 制作

Install Server

HTTP connection URL

security – no known vulnerabilities

license - not found

quality - confirmed to work

How are these scores calculated?

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Tools

构建为模型上下文协议 (MCP) 服务器，使用 Firecrawl API 提供高级网络搜索、内容提取、网络爬行和抓取功能。

Related Resources

Reddit Discussion about this server

Related MCP Servers

Search1API MCP Server
fatwang2
A
security
A
license
A
quality
A Model Context Protocol (MCP) server that provides search and crawl functionality using Search1API.
Last updated -
5
206
111
TypeScript
MIT License
mcp-server-firecrawl
mendableai
A
security
A
license
A
quality
A Model Context Protocol (MCP) server implementation that integrates with FireCrawl for advanced web scraping capabilities.
Last updated -
9
21,717
3,668
JavaScript
MIT License
DuckDuckGo MCP Server
nickclyde
A
security
A
license
A
quality
A Model Context Protocol (MCP) server that provides web search capabilities through DuckDuckGo, with additional features for content fetching and parsing.
Last updated -
2
26
Python
MIT License
Google Search MCP Server
mixelpixx
A
security
F
license
A
quality
An MCP (Model Context Protocol) server that provides Google search capabilities and webpage content analysis tools. This server enables AI models to perform Google searches and analyze webpage content programmatically.
Last updated -
3
167
52
TypeScript

View all related MCP servers

WebSearch