Skip to main content
Glama

FastGPT Knowledge Base MCP

by boleyn
MCP_TOOLS_GUIDE.md6.65 kB
# 🚀 智能知识库MCP工具指南 ## 概述 这是一个基于MCP (Model Context Protocol) 的智能知识库搜索和问答系统,能够根据用户问题自主规划搜索策略,全方位检索知识,并生成带有出处标注的综合答案。 ## 🛠️ 核心功能架构 ### 1. **智能规划层** (`planning.py`) - **问题分析器**: 自动识别问题类型和复杂度 - **搜索计划器**: 生成定制化搜索策略和任务列表 - **关键词提取**: 智能提取主要和次要关键词 ### 2. **增强搜索层** (`enhanced_search.py`) - **批量搜索**: 并发执行多个搜索任务 - **多数据集搜索**: 跨多个知识库检索 - **语义搜索**: 带上下文的智能搜索 - **结果合并**: 智能去重和排序 ### 3. **答案生成层** (`answer_generation.py`) - **答案合成器**: 根据问题类型生成结构化答案 - **引用管理**: 自动生成和格式化引用信息 - **质量评估**: 多维度评估答案质量 - **置信度计算**: 动态计算答案可信度 ## 📋 MCP工具列表 ### 🎯 核心工具 #### 1. `intelligent_search_and_answer` **最强大的综合工具** - 一站式智能问答解决方案 ```json { "question": "**数字化产品都有哪些,各自的优势和应用场景是什么?", "available_datasets": ["683e8f11d635908ed3368af2"], "generate_answer": true } ``` **功能特点**: - ✅ 自动问题分析和搜索计划生成 - ✅ 多维度并发搜索 - ✅ 智能答案合成和引用标注 - ✅ 质量评估和置信度分析 #### 2. `generate_search_plan` **搜索策略规划工具** - 分析问题并制定搜索策略 ```json { "question": "云原生技术的发展趋势如何?", "available_datasets": ["dataset_id_1", "dataset_id_2"] } ``` **功能特点**: - 📊 问题复杂度评估 - 🔍 关键词智能提取 - 📋 任务优先级排序 - 🎯 搜索策略制定 #### 3. `multi_dataset_search` **多数据集搜索工具** - 跨知识库并发搜索 ```json { "dataset_ids": ["dataset_1", "dataset_2", "dataset_3"], "query": "人工智能应用", "limit_per_dataset": 5 } ``` ### 🔧 基础工具 #### 4. `get_dataset_tree` **知识库目录树工具** - 浏览知识库结构 ```json { "search_value": "**", "deep": 4 } ``` #### 5. `search_dataset` **基础搜索工具** - 单数据集精确搜索 ```json { "dataset_id": "683e8f11d635908ed3368af2", "text": "数字化转型", "limit": 10 } ``` ## 🎨 问题类型识别 系统能自动识别以下问题类型并采用相应策略: | 问题类型 | 关键词示例 | 搜索策略 | |---------|-----------|----------| | **简单事实** | "什么是", "定义", "含义" | 精确匹配,快速定位 | | **复杂分析** | "分析", "原因", "影响" | 多维度语义搜索 | | **对比比较** | "比较", "区别", "优缺点" | 分别搜索对比对象 | | **多方面** | "全面", "综合", "各方面" | 广度优先,全覆盖 | | **流程解释** | "如何", "步骤", "方法" | 按流程顺序搜索 | | **推荐建议** | "建议", "推荐", "最佳" | 搜索专家建议和最佳实践 | ## 📊 答案质量评估 系统提供多维度的答案质量评估: - **完整性评分**: 答案内容的完整程度 - **一致性评分**: 不同来源信息的一致性 - **可靠性评分**: 基于引用质量的可信度 - **覆盖度评分**: 信息来源的多样性 - **整体置信度**: 综合评估的最终可信度 ## 🚀 使用示例 ### 示例1: 复杂问题全面问答 ```json { "tool": "intelligent_search_and_answer", "parameters": { "question": "**科技在5G领域的核心技术优势、产品布局和市场竞争力如何?", "available_datasets": ["683e8f11d635908ed3368af2"], "generate_answer": true } } ``` **系统处理流程**: 1. 🔍 分析问题:识别为"多方面问题",复杂度8/10 2. 📋 生成计划:创建5个搜索任务覆盖技术、产品、市场等维度 3. 🔄 并发搜索:在指定数据集中执行多维度搜索 4. 📝 合成答案:按"概述-特点-场景-优势-注意事项"结构生成 5. 📚 标注引用:自动生成[ref_1]等引用标记 6. 📊 质量评估:提供完整性、可靠性等评分 ### 示例2: 搜索计划生成 ```json { "tool": "generate_search_plan", "parameters": { "question": "数字化转型过程中有哪些常见的挑战和解决方案?", "available_datasets": ["dataset_1", "dataset_2"] } } ``` **输出示例**: ```markdown # 智能搜索计划 ## 🎯 用户问题 > 数字化转型过程中有哪些常见的挑战和解决方案? ## 📊 问题分析 - **问题类型**: complex_analysis - **复杂度評分**: 7/10 - **主要关键词**: 数字化转型, 挑战, 解决方案 - **搜索策略**: 深度分析策略:多维度语义搜索,收集全面信息后综合分析 ## 📋 搜索任务列表 ### 任务 1: task_1 - **搜索查询**: `数字化转型` - **优先级**: 8/10 - **搜索类型**: semantic_search ``` ## 🔧 技术架构 ``` 用户问题 ↓ [问题分析器] → 问题类型 + 复杂度 + 关键词 ↓ [搜索计划器] → 搜索任务列表 + 策略 ↓ [增强搜索器] → 并发执行 + 结果收集 ↓ [答案生成器] → 合成答案 + 引用管理 ↓ [质量评估器] → 多维度评分 + 建议 ↓ 格式化输出 (Markdown) ``` ## 🎯 最佳实践 ### 1. 选择合适的工具 - **简单查询**: 使用 `search_dataset` - **复杂问题**: 使用 `intelligent_search_and_answer` - **跨库搜索**: 使用 `multi_dataset_search` - **策略分析**: 先用 `generate_search_plan` ### 2. 优化搜索效果 - 提供准确的数据集ID列表 - 使用清晰、具体的问题描述 - 根据需要调整结果数量限制 ### 3. 理解输出结果 - 关注答案质量评分 - 查看引用来源的可靠性 - 根据置信度判断答案可信度 ## 🔮 系统优势 ### ✅ 智能化 - 自动问题分析和策略制定 - 智能关键词提取和搜索优化 - 动态答案结构生成 ### ✅ 全面性 - 多维度搜索覆盖 - 跨数据集信息整合 - 完整的引用溯源体系 ### ✅ 可靠性 - 多重质量评估机制 - 置信度量化计算 - 透明的处理过程 ### ✅ 可扩展性 - 模块化架构设计 - 可配置的搜索策略 - 支持新数据集接入 ## 📞 技术支持 如有问题或需要定制化开发,请联系开发团队。系统支持: - 自定义问题类型识别规则 - 新增搜索策略模式 - 定制化答案生成模板 - 集成外部数据源 --- *本系统基于MCP协议构建,提供标准化的AI工具调用接口*

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/boleyn/fastgpt-dataset-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server