parquet_mcp_server
一个强大的 MCP(模型控制协议)服务器,提供执行网页搜索和查找类似内容的工具。该服务器旨在与 Claude Desktop 配合使用,并提供两项主要功能:
- 网络搜索:执行网络搜索并抓取结果
- 相似性搜索:从之前的搜索中提取相关信息
该服务器特别适用于:
- 需要 Web 搜索功能的应用程序
- 需要根据搜索查询查找类似内容的项目
安装
通过 Smithery 安装
要通过Smithery自动为 Claude Desktop 安装 Parquet MCP 服务器:
克隆此存储库
创建并激活虚拟环境
安装包
环境
使用以下变量创建.env
文件:
与 Claude Desktop 一起使用
将其添加到您的 Claude Desktop 配置文件( claude_desktop_config.json
):
可用工具
该服务器提供两个主要工具:
- 搜索网页:执行网页搜索并抓取结果
- 必需参数:
queries
:搜索查询列表
- 可选参数:
page_number
:搜索结果的页码(默认为 1)
- 必需参数:
- 从搜索中提取信息:从以前的搜索中提取相关信息
- 必需参数:
queries
:要合并的搜索查询列表
- 必需参数:
示例提示
以下是您可以与代理一起使用的一些示例提示:
对于网页搜索:
从搜索中提取信息:
测试 MCP 服务器
该项目在src/tests
目录中包含一个全面的测试套件。您可以使用以下命令运行所有测试:
或者运行单独的测试:
您还可以直接使用客户端测试服务器:
故障排除
- 如果出现 SSL 验证错误,请确保
.env
文件中的 SSL 设置正确 - 如果未生成嵌入,请检查:
- Ollama 服务器正在运行并可访问
- 您的 Ollama 服务器上有指定的模型
- 文本列存在于输入的 Parquet 文件中
- 如果 DuckDB 转换失败,请检查:
- 输入 Parquet 文件存在且可读
- 您对输出目录有写入权限
- Parquet 文件未损坏
- 如果 PostgreSQL 转换失败,请检查:
.env
文件中的 PostgreSQL 连接设置正确- PostgreSQL 服务器正在运行并可访问
- 您具有创建/修改表所需的权限
- pgvector 扩展已安装在您的数据库中
用于向量相似性搜索的 PostgreSQL 函数
要在 PostgreSQL 中执行向量相似性搜索,可以使用以下函数:
此函数允许您对存储在 PostgreSQL 数据库中的向量嵌入执行相似性搜索,返回满足指定相似度阈值的结果,并根据用户输入限制结果数量。结果按日期和相似度排序。
Postgres 表创建
You must be authenticated.
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
一个强大的 MCP(模型控制协议)服务器,提供用于操作和分析 Parquet 文件的工具。该服务器旨在与 Claude Desktop 配合使用,并提供以下四个主要功能:
Related MCP Servers
- -securityFlicense-qualityA Model Context Protocol server built with mcp-framework that allows users to create and manage custom tools for processing data, integrating with the Claude Desktop via CLI.Last updated -484TypeScript
- AsecurityAlicenseAqualityA Model Context Protocol (MCP) server that provides tools for reading Excel (xlsx) files, enabling extraction of data from entire workbooks or specific sheets with results returned in structured JSON format.Last updated -35PythonApache 2.0
Semgrep MCP Serverofficial
AsecurityAlicenseAqualityAn MCP server that provides a comprehensive interface to Semgrep, enabling users to scan code for security vulnerabilities, create custom rules, and analyze scan results through the Model Context Protocol.Last updated -6172PythonMIT License- -securityFlicense-qualityA Model Context Protocol server that provides tools for interacting with databases, including PostgreSQL, DuckDB, and Google Cloud Storage Parquet files.Last updated -2TypeScript