de en es ja ko ru zh

baidu-ai-search

Official

by baidubce

Overview Schema Related Servers Score Discussions

Python

Remote

README.md

README.md•3.62 KiB

# 向量检索-BES（BaiduElasticSearchRetriever） ## 简介向量检索-BES组件（BaiduElasticSearchRetriever）基于一款Baidu ElasticSearch的内容检索组件，支持根据文本的向量的相似度进行内容检索。 ### 功能介绍向量检索-BES组件（BaiduElasticSearchRetriever）用于在将文本内容输入到Baidu ElasticSearch，根据文本的向量相似度进行高效的内容检索。 ### 特色优势 - 高效准确：基于Baidu ElasticSearch的强大能力，提供高效且准确的内容检索功能。 ### 应用场景各种内容检索场景 ## 准备工作在使用BaiduElasticSearchRetriever进行内容检索之前，需要到Baidu ElasticSearch官网创建相应的集群，详情见[教程](https://cloud.baidu.com/doc/BES/s/gke3ocf89)。注：创建集群时请选择7.10.2版本的ES，否则可能无法使用本组件。 ## 基本用法以下是有关如何开始使用BESRetriever的代码示例： ```python import os import appbuilder # 请前往千帆AppBuilder官网创建密钥，流程详见：https://cloud.baidu.com/doc/AppBuilder/s/Olq6grrt6#1%E3%80%81%E5%88%9B%E5%BB%BA%E5%AF%86%E9%92%A5 os.environ["APPBUILDER_TOKEN"] = '...' embedding = appbuilder.Embedding() segments = appbuilder.Message(["文心一言大模型", "百度在线科技有限公司"]) # 初始化构建索引 vector_index = appbuilder.BESVectorStoreIndex.from_segments(segments=segments, cluster_id=es_cluster_id, user_name=es_username, password=es_password, embedding=embedding) # 获取当前索引中的全部内容 all_content = vector_index.get_all_segments() print(all_content) # 转化为retriever retriever = vector_index.as_retriever() # 按照query进行检索 query = appbuilder.Message("文心一言") res = retriever(query=query, top_k=1) print(res) # 删除当前索引中的全部内容 vector_index.delete_all_segments() ``` ## 参数说明 ### 鉴权说明使用组件之前，请首先申请并设置鉴权参数，可参考[组件使用流程](https://cloud.baidu.com/doc/AppBuilder/s/Olq6grrt6#1%E3%80%81%E5%88%9B%E5%BB%BA%E5%AF%86%E9%92%A5)。 ```python # 设置环境中的TOKEN，以下示例略 os.environ["APPBUILDER_TOKEN"] = "bce-YOURTOKEN" ``` ### 初始化参数说明： - segments （Message[List[str]]，必填）：需要入库的文本段落 - cluster_id （str，必填）：ElacticSearch集群的id，创建集群时获取 - user_name （str，必填）：连接ES集群所需的用户名，创建集群时获取 - password （str，必填）：连接ES集群所需的密码，创建集群时获取 - embedding （obj，非必填）：用于将文本转为向量的模型，默认为Embedding ### 调用参数： | 参数名称 | 参数类型 |是否必须 | 描述 | 示例值 | |---------|--------|--------|------------------|---------------| | message | String |是 | 需要检索的内容 | "中国2023人均GDP" | | top_k | int |否 | 返回相似度最高的top_k个内容 | 1 | ### 响应参数 | 参数名称 | 参数类型 | 描述 | 示例值 | |------|--------|-----|--------------------| | text | string | 检索结果 | "中国2023年人均GDP8.94万元" | | score | float | 相似度 | 0.95 | | meta | dict | 元信息 | "" | ### 响应示例 ```json {"text": "中国2023年人均GDP8.94万元", "score": 0.95, "meta": ""} ``` ## 高级用法：本组件根据向量的相似度进行检索，支持使用不同的embedding方法和索引方式来优化检索的效果。 ## 更新记录和贡献 * 向量检索能力 (2023-12)

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/baidubce/app-builder'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

README.md•3.62 KiB