mcp-嵌入-搜索
一个模型上下文协议 (MCP) 服务器,用于查询包含嵌入和转录片段的 Turso 数据库。此工具允许用户通过提问来搜索相关的转录片段,而无需生成新的嵌入。
特征
🔍 转录片段的向量相似性搜索
📊 基于余弦相似度的相关性评分
📝 完整的成绩单元数据(剧集标题、时间戳)
⚙️ 可配置的搜索参数(限制、最低分数)
🔄 高效的数据库连接池
🛡️ 全面的错误处理
📈 性能优化,响应速度更快
Related MCP server: Better Qdrant MCP Server
配置
此服务器需要通过您的 MCP 客户端进行配置。以下是不同环境下的示例:
克莱恩配置
将其添加到您的 Cline MCP 设置中:
{
"mcpServers": {
"mcp-embedding-search": {
"command": "node",
"args": ["/path/to/mcp-embedding-search/dist/index.js"],
"env": {
"TURSO_URL": "your-turso-database-url",
"TURSO_AUTH_TOKEN": "your-turso-auth-token"
}
}
}
}
Claude桌面配置
将其添加到您的 Claude Desktop 配置中:
{
"mcpServers": {
"mcp-embedding-search": {
"command": "node",
"args": ["/path/to/mcp-embedding-search/dist/index.js"],
"env": {
"TURSO_URL": "your-turso-database-url",
"TURSO_AUTH_TOKEN": "your-turso-auth-token"
}
}
}
}
API
服务器实现了一个 MCP 工具:
搜索嵌入
使用向量相似性搜索相关的转录片段。
参数:
question (字符串,必需):要搜索的查询文本
limit (数字,可选):返回的结果数(默认值:5,最大值:50)
min_score (数字,可选):最小相似度阈值(默认值:0.5,范围:0-1)
响应格式:
[
{
"episode_title": "Episode Title",
"segment_text": "Transcript segment content...",
"start_time": 123.45,
"end_time": 167.89,
"similarity": 0.85
}
// Additional results...
]
数据库架构
此工具需要具有以下架构的 Turso 数据库:
CREATE TABLE embeddings (
id INTEGER PRIMARY KEY AUTOINCREMENT,
transcript_id INTEGER NOT NULL,
embedding TEXT NOT NULL,
FOREIGN KEY(transcript_id) REFERENCES transcripts(id)
);
CREATE TABLE transcripts (
id INTEGER PRIMARY KEY AUTOINCREMENT,
episode_title TEXT NOT NULL,
segment_text TEXT NOT NULL,
start_time REAL NOT NULL,
end_time REAL NOT NULL
);
embedding列应包含可与vector_distance_cos函数一起使用的向量嵌入。
发展
设置
克隆存储库
安装依赖项:
构建项目:
以开发模式运行:
出版
该项目使用变更集进行版本管理。要发布:
创建变更集:
对包进行版本控制:
发布到 npm:
贡献
欢迎贡献代码!欢迎提交 Pull 请求。
执照
MIT 许可证 - 有关详细信息,请参阅LICENSE文件。
致谢