Skip to main content
Glama

WebSearch - 高级网页搜索和内容提取工具

执照Python 版本火爬紫外线

使用 Python 构建的强大的网络搜索和内容提取工具,利用 Firecrawl API 实现高级网络抓取、搜索和内容分析功能。

🚀 功能

  • 高级网页搜索:使用可自定义的参数执行智能网页搜索
  • 内容提取:使用自然语言提示从网页中提取特定信息
  • 网络爬取:爬取具有可配置深度和限制的网站
  • 网页抓取:抓取网页,支持多种输出格式
  • MCP 集成:构建为模型上下文协议 (MCP) 服务器,实现无缝集成

📋 先决条件

  • Python 3.8 或更高版本
  • uv 包管理器
  • Firecrawl API 密钥
  • OpenAI API 密钥(可选,用于增强功能)
  • Tavily API 密钥(可选,用于附加搜索功能)

🛠️ 安装

  1. 安装 uv:
# On Windows (using pip) pip install uv # On Unix/MacOS curl -LsSf https://astral.sh/uv/install.sh | sh # Add uv to PATH (Unix/MacOS) export PATH="$HOME/.local/bin:$PATH" # Add uv to PATH (Windows - add to Environment Variables) # Add: %USERPROFILE%\.local\bin
  1. 克隆存储库:
git clone https://github.com/yourusername/websearch.git cd websearch
  1. 使用 uv 创建并激活虚拟环境:
# Create virtual environment uv venv # Activate on Windows .\.venv\Scripts\activate.ps1 # Activate on Unix/MacOS source .venv/bin/activate
  1. 使用 uv 安装依赖项:
# Install from requirements.txt uv sync
  1. 设置环境变量:
# Create .env file touch .env # Add your API keys FIRECRAWL_API_KEY=your_firecrawl_api_key OPENAI_API_KEY=your_openai_api_key

🎯 使用方法

使用 Claude 桌面版进行设置

您无需直接运行服务器,而是可以配置 Claude for Desktop 来访问 WebSearch 工具:

  1. 找到或创建您的 Claude for Desktop 配置文件:
    • Windows: %env:AppData%\Claude\claude_desktop_config.json
    • macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
  2. 将 WebSearch 服务器配置添加到mcpServers部分:
{ "mcpServers": { "websearch": { "command": "uv", "args": [ "--directory", "D:\\ABSOLUTE\\PATH\\TO\\WebSearch", "run", "main.py" ] } } }
  1. 确保将目录路径替换为 WebSearch 项目文件夹的绝对路径。
  2. 保存配置文件并重新启动 Claude for Desktop。
  3. 配置完成后,WebSearch 工具将出现在 Claude for Desktop 的工具菜单(锤子图标)中。

可用工具

  1. 搜索
  2. 提取信息
  3. 抓取网站
  4. 抓取内容

📚 API 参考

搜索

  • query (str):搜索查询
  • 返回:JSON格式的搜索结果

提炼

  • urls (List[str]):从中提取信息的 URL 列表
  • prompt (str): 提取说明
  • enableWebSearch (bool): 启用补充网页搜索
  • showSources (bool):包含源引用
  • 返回:以指定格式提取的信息

爬行

  • url (str): 起始 URL
  • maxDepth (int):最大爬行深度
  • limit (int):抓取的最大页面数
  • 返回:以 markdown/HTML 格式抓取的内容

  • url (str):目标 URL
  • 返回:带有可选屏幕截图的抓取内容

🔧 配置

环境变量

该工具需要特定的 API 密钥才能运行。我们提供了一个.env.example文件,您可以将其用作模板:

  1. 复制示例文件:
# On Unix/MacOS cp .env.example .env # On Windows copy .env.example .env
  1. 使用您的 API 密钥编辑.env文件:
# OpenAI API key - Required for AI-powered features OPENAI_API_KEY=your_openai_api_key_here # Firecrawl API key - Required for web scraping and searching FIRECRAWL_API_KEY=your_firecrawl_api_key_here

获取 API 密钥

  1. OpenAI API密钥
    • 访问OpenAI 平台
    • 注册或登录
    • 导航至 API 密钥部分
    • 创建新的密钥
  2. Firecrawl API密钥

如果一切配置正确,您应该会收到包含搜索结果的 JSON 响应。

故障排除

如果遇到错误:

  1. 确保所有必需的 API 密钥都已在.env文件中设置
  2. 验证 API 密钥是否有效且未过期
  3. 检查.env文件是否位于项目的根目录中
  4. 确保环境变量正确加载

🤝 贡献

  1. 分叉存储库
  2. 创建你的功能分支( git checkout -b feature/AmazingFeature
  3. 提交您的更改( git commit -m 'Add some AmazingFeature'
  4. 推送到分支( git push origin feature/AmazingFeature
  5. 打开拉取请求

📝 许可证

该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅LICENSE文件。

🙏 致谢

📬 联系方式

何塞·马丁·罗德里格斯·莫塔洛尼 - @m4s1t425 - jmrodriguezm13@gmail.com


使用 Python 和 Firecrawl 用 ❤️ 制作

Deploy Server
A
security – no known vulnerabilities
F
license - not found
A
quality - confirmed to work

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

构建为模型上下文协议 (MCP) 服务器,使用 Firecrawl API 提供高级网络搜索、内容提取、网络爬行和抓取功能。

  1. 🚀 功能
    1. 📋 先决条件
      1. 🛠️ 安装
        1. 🎯 使用方法
          1. 使用 Claude 桌面版进行设置
          2. 可用工具
        2. 📚 API 参考
          1. 搜索
          2. 提炼
          3. 爬行
        3. 🔧 配置
          1. 环境变量
          2. 获取 API 密钥
          3. 故障排除
        4. 🤝 贡献
          1. 📝 许可证
            1. 🙏 致谢
              1. 📬 联系方式

                Related MCP Servers

                • A
                  security
                  A
                  license
                  A
                  quality
                  A Model Context Protocol (MCP) server that provides search and crawl functionality using Search1API.
                  Last updated -
                  197
                  153
                  MIT License
                  • Apple
                • A
                  security
                  A
                  license
                  A
                  quality
                  A Model Context Protocol (MCP) server implementation that integrates with FireCrawl for advanced web scraping capabilities.
                  Last updated -
                  22,372
                  4,482
                  MIT License
                  • Apple
                  • Linux
                • A
                  security
                  A
                  license
                  A
                  quality
                  A Model Context Protocol server that enables web search, scraping, crawling, and content extraction through multiple engines including SearXNG, Firecrawl, and Tavily.
                  Last updated -
                  4
                  45
                  53
                  MIT License
                • -
                  security
                  A
                  license
                  -
                  quality
                  A Model Context Protocol server that enables AI assistants to perform advanced web scraping, crawling, searching, and data extraction through the Firecrawl API.
                  Last updated -
                  22,372
                  MIT License
                  • Apple
                  • Linux

                View all related MCP servers

                MCP directory API

                We provide all the information about MCP servers via our MCP API.

                curl -X GET 'https://glama.ai/api/mcp/v1/servers/josemartinrodriguezmortaloni/webSearch-Tools'

                If you have feedback or need assistance with the MCP directory API, please join our Discord server