MemOS-MCP

QWEN_MODEL_CONFIGURATION.md•4.5 KiB

# Qwen模型配置完成报告

## 📋 配置总结

已成功将MemOS系统的嵌入模型和重排模型更换为Qwen模型，并设为默认配置。

### 🔧 模型配置

| 组件 | 原模型 | 新模型 | 状态 |
|------|--------|--------|------|
| 嵌入模型 | BAAI/bge-m3 | **Qwen/Qwen3-Embedding-0.6B** | ✅ 已更新 |
| 重排模型 | BAAI/bge-reranker-v2-m3 | **Qwen/Qwen3-Reranker-0.6B** | ✅ 已更新 |
| 向量维度 | 1024维 | **1024维** | ✅ 保持一致 |
| API服务 | SiliconFlow | **SiliconFlow** | ✅ 保持一致 |

### 📁 修改的文件

#### 1. 核心配置文件
- `src/memos/configs/embedder.py` - 默认嵌入模型改为Qwen3-Embedding-0.6B
- `src/memos/configs/reranker.py` - 默认重排模型改为Qwen3-Reranker-0.6B

#### 2. 实现文件
- `src/memos/embedders/siliconflow.py` - 更新默认模型和维度检测
- `src/memos/rerankers/siliconflow.py` - 更新默认重排模型

#### 3. 测试文件
- `test_siliconflow_embedder.py` - 更新测试配置使用Qwen模型
- `test_siliconflow_reranker.py` - 更新测试配置使用Qwen模型

#### 4. 新增文件
- `qwen_embedding_config.py` - Qwen模型配置工具
- `enhanced_simple_memos.py` - 增强版MemOS实现
- `test_qwen_integration.py` - Qwen模型集成测试
- `test_default_qwen.py` - 默认配置测试
- `simple_test_qwen.py` - 简化测试脚本

#### 5. MVP记忆管理器
- `mvp_memory.py` - 默认启用增强版MemOS，支持自动降级

#### 6. MCP服务器
- `memos_mcp_server.py` - 默认使用MVP管理器和Qwen模型

### 🚀 默认行为

#### 系统启动时
1. **优先尝试**：增强版MemOS (Qwen3-Embedding-0.6B + Qwen3-Reranker-0.6B)
2. **自动降级**：如果依赖不满足，降级到基础版 (哈希向量)
3. **用户提示**：清晰显示当前使用的模型类型

#### MVP记忆管理器
```python
# 默认使用增强版
mvp_manager = MVPMemoryManager()  # use_enhanced=True (默认)

# 显式使用基础版
mvp_manager = MVPMemoryManager(use_enhanced=False)
```

#### 智能检索
```python
# 默认启用重排器
results = mvp_manager.recall(query)  # use_reranker=True (默认)

# 禁用重排器
results = mvp_manager.recall(query, use_reranker=False)
```

### 📊 功能对比

| 功能 | 基础版 | 增强版 (Qwen) |
|------|--------|---------------|
| 嵌入向量 | 哈希向量 (384维) | Qwen3-Embedding-0.6B (1024维) |
| 语义理解 | 基础 | 高质量 |
| 搜索精度 | 一般 | 显著提升 |
| 重排优化 | 无 | Qwen3-Reranker-0.6B |
| 依赖要求 | 最小 | 需要网络API |
| 响应速度 | 快 | 稍慢 (API调用) |

### 🔄 使用方式

#### CLI界面
```bash
# 自动使用Qwen模型
python3 memos_cli.py
```

#### MCP服务器
```bash
# 自动使用Qwen模型
python3 memos_mcp_server.py
```

#### 编程接口
```python
from mvp_memory import MVPMemoryManager

# 创建管理器 - 默认使用Qwen模型
manager = MVPMemoryManager()

# 添加记忆 - 使用Qwen嵌入
manager.remember("这是一个测试记忆", tags=["测试"])

# 智能检索 - 使用Qwen嵌入+重排
results = manager.recall("测试记忆", top_k=5)
```

### ⚙️ 环境要求

#### 必需依赖
- `openai>=1.77.0` - SiliconFlow API客户端
- `qdrant-client>=1.14.2` - 向量数据库
- `pyyaml>=6.0` - 配置文件解析
- `pydantic>=2.11.7` - 数据验证
- `requests>=2.32.4` - HTTP请求

#### 环境变量
```bash
SILICONFLOW_API_KEY=sk-ygqlrgrxrypykiiskuspuahkwihhbhhjhazqokntwdzfwqdv
SILICONFLOW_BASE_URL=https://api.siliconflow.cn/v1
```

### 🎯 优势

1. **高质量嵌入**：Qwen3-Embedding-0.6B提供更准确的语义理解
2. **精准重排**：Qwen3-Reranker-0.6B显著提升搜索相关性
3. **无缝升级**：保持API兼容性，用户无感知切换
4. **自动降级**：环境不满足时自动使用基础版
5. **默认启用**：新用户直接享受最佳体验

### 🔍 验证方法

1. **检查配置**：查看启动日志中的模型信息
2. **功能测试**：使用CLI或API进行记忆添加和检索
3. **性能对比**：对比基础版和增强版的搜索结果质量

### 📝 注意事项

1. **网络依赖**：增强版需要稳定的网络连接访问SiliconFlow API
2. **API配额**：注意SiliconFlow API的使用限制
3. **降级机制**：确保基础版功能正常，作为后备方案
4. **向量维度**：新系统使用1024维向量，与旧数据不兼容

## ✅ 配置完成

Qwen模型已成功配置为MemOS系统的默认嵌入和重排模型。系统将优先使用高质量的Qwen模型，在环境不满足时自动降级到基础版本，确保系统的稳定性和可用性。

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/qinshu1109/memos-MCP'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

QWEN_MODEL_CONFIGURATION.md•4.5 KiB

# Qwen模型配置完成报告

## 📋 配置总结

已成功将MemOS系统的嵌入模型和重排模型更换为Qwen模型，并设为默认配置。

### 🔧 模型配置

| 组件 | 原模型 | 新模型 | 状态 |
|------|--------|--------|------|
| 嵌入模型 | BAAI/bge-m3 | **Qwen/Qwen3-Embedding-0.6B** | ✅ 已更新 |
| 重排模型 | BAAI/bge-reranker-v2-m3 | **Qwen/Qwen3-Reranker-0.6B** | ✅ 已更新 |
| 向量维度 | 1024维 | **1024维** | ✅ 保持一致 |
| API服务 | SiliconFlow | **SiliconFlow** | ✅ 保持一致 |

### 📁 修改的文件

#### 1. 核心配置文件
- `src/memos/configs/embedder.py` - 默认嵌入模型改为Qwen3-Embedding-0.6B
- `src/memos/configs/reranker.py` - 默认重排模型改为Qwen3-Reranker-0.6B

#### 2. 实现文件
- `src/memos/embedders/siliconflow.py` - 更新默认模型和维度检测
- `src/memos/rerankers/siliconflow.py` - 更新默认重排模型

#### 3. 测试文件
- `test_siliconflow_embedder.py` - 更新测试配置使用Qwen模型
- `test_siliconflow_reranker.py` - 更新测试配置使用Qwen模型

#### 4. 新增文件
- `qwen_embedding_config.py` - Qwen模型配置工具
- `enhanced_simple_memos.py` - 增强版MemOS实现
- `test_qwen_integration.py` - Qwen模型集成测试
- `test_default_qwen.py` - 默认配置测试
- `simple_test_qwen.py` - 简化测试脚本

#### 5. MVP记忆管理器
- `mvp_memory.py` - 默认启用增强版MemOS，支持自动降级

#### 6. MCP服务器
- `memos_mcp_server.py` - 默认使用MVP管理器和Qwen模型

### 🚀 默认行为

#### 系统启动时
1. **优先尝试**：增强版MemOS (Qwen3-Embedding-0.6B + Qwen3-Reranker-0.6B)
2. **自动降级**：如果依赖不满足，降级到基础版 (哈希向量)
3. **用户提示**：清晰显示当前使用的模型类型

#### MVP记忆管理器
```python
# 默认使用增强版
mvp_manager = MVPMemoryManager()  # use_enhanced=True (默认)

# 显式使用基础版
mvp_manager = MVPMemoryManager(use_enhanced=False)
```

#### 智能检索
```python
# 默认启用重排器
results = mvp_manager.recall(query)  # use_reranker=True (默认)

# 禁用重排器
results = mvp_manager.recall(query, use_reranker=False)
```

### 📊 功能对比

| 功能 | 基础版 | 增强版 (Qwen) |
|------|--------|---------------|
| 嵌入向量 | 哈希向量 (384维) | Qwen3-Embedding-0.6B (1024维) |
| 语义理解 | 基础 | 高质量 |
| 搜索精度 | 一般 | 显著提升 |
| 重排优化 | 无 | Qwen3-Reranker-0.6B |
| 依赖要求 | 最小 | 需要网络API |
| 响应速度 | 快 | 稍慢 (API调用) |

### 🔄 使用方式

#### CLI界面
```bash
# 自动使用Qwen模型
python3 memos_cli.py
```

#### MCP服务器
```bash
# 自动使用Qwen模型
python3 memos_mcp_server.py
```

#### 编程接口
```python
from mvp_memory import MVPMemoryManager

# 创建管理器 - 默认使用Qwen模型
manager = MVPMemoryManager()

# 添加记忆 - 使用Qwen嵌入
manager.remember("这是一个测试记忆", tags=["测试"])

# 智能检索 - 使用Qwen嵌入+重排
results = manager.recall("测试记忆", top_k=5)
```

### ⚙️ 环境要求

#### 必需依赖
- `openai>=1.77.0` - SiliconFlow API客户端
- `qdrant-client>=1.14.2` - 向量数据库
- `pyyaml>=6.0` - 配置文件解析
- `pydantic>=2.11.7` - 数据验证
- `requests>=2.32.4` - HTTP请求

#### 环境变量
```bash
SILICONFLOW_API_KEY=sk-ygqlrgrxrypykiiskuspuahkwihhbhhjhazqokntwdzfwqdv
SILICONFLOW_BASE_URL=https://api.siliconflow.cn/v1
```

### 🎯 优势

1. **高质量嵌入**：Qwen3-Embedding-0.6B提供更准确的语义理解
2. **精准重排**：Qwen3-Reranker-0.6B显著提升搜索相关性
3. **无缝升级**：保持API兼容性，用户无感知切换
4. **自动降级**：环境不满足时自动使用基础版
5. **默认启用**：新用户直接享受最佳体验

### 🔍 验证方法

1. **检查配置**：查看启动日志中的模型信息
2. **功能测试**：使用CLI或API进行记忆添加和检索
3. **性能对比**：对比基础版和增强版的搜索结果质量

### 📝 注意事项

1. **网络依赖**：增强版需要稳定的网络连接访问SiliconFlow API
2. **API配额**：注意SiliconFlow API的使用限制
3. **降级机制**：确保基础版功能正常，作为后备方案
4. **向量维度**：新系统使用1024维向量，与旧数据不兼容

## ✅ 配置完成

Qwen模型已成功配置为MemOS系统的默认嵌入和重排模型。系统将优先使用高质量的Qwen模型，在环境不满足时自动降级到基础版本，确保系统的稳定性和可用性。