QWEN_MODEL_CONFIGURATION.md•4.61 kB
# Qwen模型配置完成报告
## 📋 配置总结
已成功将MemOS系统的嵌入模型和重排模型更换为Qwen模型,并设为默认配置。
### 🔧 模型配置
| 组件 | 原模型 | 新模型 | 状态 |
|------|--------|--------|------|
| 嵌入模型 | BAAI/bge-m3 | **Qwen/Qwen3-Embedding-0.6B** | ✅ 已更新 |
| 重排模型 | BAAI/bge-reranker-v2-m3 | **Qwen/Qwen3-Reranker-0.6B** | ✅ 已更新 |
| 向量维度 | 1024维 | **1024维** | ✅ 保持一致 |
| API服务 | SiliconFlow | **SiliconFlow** | ✅ 保持一致 |
### 📁 修改的文件
#### 1. 核心配置文件
- `src/memos/configs/embedder.py` - 默认嵌入模型改为Qwen3-Embedding-0.6B
- `src/memos/configs/reranker.py` - 默认重排模型改为Qwen3-Reranker-0.6B
#### 2. 实现文件
- `src/memos/embedders/siliconflow.py` - 更新默认模型和维度检测
- `src/memos/rerankers/siliconflow.py` - 更新默认重排模型
#### 3. 测试文件
- `test_siliconflow_embedder.py` - 更新测试配置使用Qwen模型
- `test_siliconflow_reranker.py` - 更新测试配置使用Qwen模型
#### 4. 新增文件
- `qwen_embedding_config.py` - Qwen模型配置工具
- `enhanced_simple_memos.py` - 增强版MemOS实现
- `test_qwen_integration.py` - Qwen模型集成测试
- `test_default_qwen.py` - 默认配置测试
- `simple_test_qwen.py` - 简化测试脚本
#### 5. MVP记忆管理器
- `mvp_memory.py` - 默认启用增强版MemOS,支持自动降级
#### 6. MCP服务器
- `memos_mcp_server.py` - 默认使用MVP管理器和Qwen模型
### 🚀 默认行为
#### 系统启动时
1. **优先尝试**:增强版MemOS (Qwen3-Embedding-0.6B + Qwen3-Reranker-0.6B)
2. **自动降级**:如果依赖不满足,降级到基础版 (哈希向量)
3. **用户提示**:清晰显示当前使用的模型类型
#### MVP记忆管理器
```python
# 默认使用增强版
mvp_manager = MVPMemoryManager() # use_enhanced=True (默认)
# 显式使用基础版
mvp_manager = MVPMemoryManager(use_enhanced=False)
```
#### 智能检索
```python
# 默认启用重排器
results = mvp_manager.recall(query) # use_reranker=True (默认)
# 禁用重排器
results = mvp_manager.recall(query, use_reranker=False)
```
### 📊 功能对比
| 功能 | 基础版 | 增强版 (Qwen) |
|------|--------|---------------|
| 嵌入向量 | 哈希向量 (384维) | Qwen3-Embedding-0.6B (1024维) |
| 语义理解 | 基础 | 高质量 |
| 搜索精度 | 一般 | 显著提升 |
| 重排优化 | 无 | Qwen3-Reranker-0.6B |
| 依赖要求 | 最小 | 需要网络API |
| 响应速度 | 快 | 稍慢 (API调用) |
### 🔄 使用方式
#### CLI界面
```bash
# 自动使用Qwen模型
python3 memos_cli.py
```
#### MCP服务器
```bash
# 自动使用Qwen模型
python3 memos_mcp_server.py
```
#### 编程接口
```python
from mvp_memory import MVPMemoryManager
# 创建管理器 - 默认使用Qwen模型
manager = MVPMemoryManager()
# 添加记忆 - 使用Qwen嵌入
manager.remember("这是一个测试记忆", tags=["测试"])
# 智能检索 - 使用Qwen嵌入+重排
results = manager.recall("测试记忆", top_k=5)
```
### ⚙️ 环境要求
#### 必需依赖
- `openai>=1.77.0` - SiliconFlow API客户端
- `qdrant-client>=1.14.2` - 向量数据库
- `pyyaml>=6.0` - 配置文件解析
- `pydantic>=2.11.7` - 数据验证
- `requests>=2.32.4` - HTTP请求
#### 环境变量
```bash
SILICONFLOW_API_KEY=sk-ygqlrgrxrypykiiskuspuahkwihhbhhjhazqokntwdzfwqdv
SILICONFLOW_BASE_URL=https://api.siliconflow.cn/v1
```
### 🎯 优势
1. **高质量嵌入**:Qwen3-Embedding-0.6B提供更准确的语义理解
2. **精准重排**:Qwen3-Reranker-0.6B显著提升搜索相关性
3. **无缝升级**:保持API兼容性,用户无感知切换
4. **自动降级**:环境不满足时自动使用基础版
5. **默认启用**:新用户直接享受最佳体验
### 🔍 验证方法
1. **检查配置**:查看启动日志中的模型信息
2. **功能测试**:使用CLI或API进行记忆添加和检索
3. **性能对比**:对比基础版和增强版的搜索结果质量
### 📝 注意事项
1. **网络依赖**:增强版需要稳定的网络连接访问SiliconFlow API
2. **API配额**:注意SiliconFlow API的使用限制
3. **降级机制**:确保基础版功能正常,作为后备方案
4. **向量维度**:新系统使用1024维向量,与旧数据不兼容
## ✅ 配置完成
Qwen模型已成功配置为MemOS系统的默认嵌入和重排模型。系统将优先使用高质量的Qwen模型,在环境不满足时自动降级到基础版本,确保系统的稳定性和可用性。