Skip to main content
Glama

MemOS-MCP

by qinshu1109
Apache 2.0
3
  • Linux
  • Apple
QWEN_MODEL_CONFIGURATION.md4.61 kB
# Qwen模型配置完成报告 ## 📋 配置总结 已成功将MemOS系统的嵌入模型和重排模型更换为Qwen模型,并设为默认配置。 ### 🔧 模型配置 | 组件 | 原模型 | 新模型 | 状态 | |------|--------|--------|------| | 嵌入模型 | BAAI/bge-m3 | **Qwen/Qwen3-Embedding-0.6B** | ✅ 已更新 | | 重排模型 | BAAI/bge-reranker-v2-m3 | **Qwen/Qwen3-Reranker-0.6B** | ✅ 已更新 | | 向量维度 | 1024维 | **1024维** | ✅ 保持一致 | | API服务 | SiliconFlow | **SiliconFlow** | ✅ 保持一致 | ### 📁 修改的文件 #### 1. 核心配置文件 - `src/memos/configs/embedder.py` - 默认嵌入模型改为Qwen3-Embedding-0.6B - `src/memos/configs/reranker.py` - 默认重排模型改为Qwen3-Reranker-0.6B #### 2. 实现文件 - `src/memos/embedders/siliconflow.py` - 更新默认模型和维度检测 - `src/memos/rerankers/siliconflow.py` - 更新默认重排模型 #### 3. 测试文件 - `test_siliconflow_embedder.py` - 更新测试配置使用Qwen模型 - `test_siliconflow_reranker.py` - 更新测试配置使用Qwen模型 #### 4. 新增文件 - `qwen_embedding_config.py` - Qwen模型配置工具 - `enhanced_simple_memos.py` - 增强版MemOS实现 - `test_qwen_integration.py` - Qwen模型集成测试 - `test_default_qwen.py` - 默认配置测试 - `simple_test_qwen.py` - 简化测试脚本 #### 5. MVP记忆管理器 - `mvp_memory.py` - 默认启用增强版MemOS,支持自动降级 #### 6. MCP服务器 - `memos_mcp_server.py` - 默认使用MVP管理器和Qwen模型 ### 🚀 默认行为 #### 系统启动时 1. **优先尝试**:增强版MemOS (Qwen3-Embedding-0.6B + Qwen3-Reranker-0.6B) 2. **自动降级**:如果依赖不满足,降级到基础版 (哈希向量) 3. **用户提示**:清晰显示当前使用的模型类型 #### MVP记忆管理器 ```python # 默认使用增强版 mvp_manager = MVPMemoryManager() # use_enhanced=True (默认) # 显式使用基础版 mvp_manager = MVPMemoryManager(use_enhanced=False) ``` #### 智能检索 ```python # 默认启用重排器 results = mvp_manager.recall(query) # use_reranker=True (默认) # 禁用重排器 results = mvp_manager.recall(query, use_reranker=False) ``` ### 📊 功能对比 | 功能 | 基础版 | 增强版 (Qwen) | |------|--------|---------------| | 嵌入向量 | 哈希向量 (384维) | Qwen3-Embedding-0.6B (1024维) | | 语义理解 | 基础 | 高质量 | | 搜索精度 | 一般 | 显著提升 | | 重排优化 | 无 | Qwen3-Reranker-0.6B | | 依赖要求 | 最小 | 需要网络API | | 响应速度 | 快 | 稍慢 (API调用) | ### 🔄 使用方式 #### CLI界面 ```bash # 自动使用Qwen模型 python3 memos_cli.py ``` #### MCP服务器 ```bash # 自动使用Qwen模型 python3 memos_mcp_server.py ``` #### 编程接口 ```python from mvp_memory import MVPMemoryManager # 创建管理器 - 默认使用Qwen模型 manager = MVPMemoryManager() # 添加记忆 - 使用Qwen嵌入 manager.remember("这是一个测试记忆", tags=["测试"]) # 智能检索 - 使用Qwen嵌入+重排 results = manager.recall("测试记忆", top_k=5) ``` ### ⚙️ 环境要求 #### 必需依赖 - `openai>=1.77.0` - SiliconFlow API客户端 - `qdrant-client>=1.14.2` - 向量数据库 - `pyyaml>=6.0` - 配置文件解析 - `pydantic>=2.11.7` - 数据验证 - `requests>=2.32.4` - HTTP请求 #### 环境变量 ```bash SILICONFLOW_API_KEY=sk-ygqlrgrxrypykiiskuspuahkwihhbhhjhazqokntwdzfwqdv SILICONFLOW_BASE_URL=https://api.siliconflow.cn/v1 ``` ### 🎯 优势 1. **高质量嵌入**:Qwen3-Embedding-0.6B提供更准确的语义理解 2. **精准重排**:Qwen3-Reranker-0.6B显著提升搜索相关性 3. **无缝升级**:保持API兼容性,用户无感知切换 4. **自动降级**:环境不满足时自动使用基础版 5. **默认启用**:新用户直接享受最佳体验 ### 🔍 验证方法 1. **检查配置**:查看启动日志中的模型信息 2. **功能测试**:使用CLI或API进行记忆添加和检索 3. **性能对比**:对比基础版和增强版的搜索结果质量 ### 📝 注意事项 1. **网络依赖**:增强版需要稳定的网络连接访问SiliconFlow API 2. **API配额**:注意SiliconFlow API的使用限制 3. **降级机制**:确保基础版功能正常,作为后备方案 4. **向量维度**:新系统使用1024维向量,与旧数据不兼容 ## ✅ 配置完成 Qwen模型已成功配置为MemOS系统的默认嵌入和重排模型。系统将优先使用高质量的Qwen模型,在环境不满足时自动降级到基础版本,确保系统的稳定性和可用性。

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/qinshu1109/memos-MCP'

If you have feedback or need assistance with the MCP directory API, please join our Discord server