Skip to main content
Glama

AI Research MCP Server

by nanyang12138
PROJECT_SUMMARY.md7.32 kB
# AI Research MCP Server - 项目总结 ## 项目概述 **AI Research MCP Server** 是一个基于 Model Context Protocol (MCP) 的服务器,用于追踪和获取最新的 AI/LLM 研究进展。 ### 核心价值 解决研究者面临的信息滞后问题,让您能够: - ⚡ 实时追踪最新的 AI 研究论文 - 🔥 发现热门的开源项目和代码实现 - 🤖 了解最新发布的模型和工具 - 📊 自动生成每日/每周研究汇总 ## 技术实现 ### 架构 ``` AI Research MCP Server ├── MCP Protocol Layer (服务器接口) ├── Tool Handlers (8 个工具) ├── Resource Providers (2 个资源) ├── Data Source Clients (4 个客户端) │ ├── arXiv Client │ ├── GitHub Client │ ├── Hugging Face Client │ └── Papers with Code Client └── Cache Manager (缓存优化) ``` ### 数据源 1. **arXiv** - 学术论文预印本 - 15+ AI 相关类别 - 支持关键词和时间筛选 - 覆盖所有主流 AI 领域 2. **GitHub** - 开源代码仓库 - 智能搜索算法 - 追踪 trending 项目 - 按主题和语言过滤 3. **Hugging Face** - 模型和数据集平台 - 每日精选论文 - 热门模型追踪 - 数据集更新监控 4. **Papers with Code** - 论文+代码配对 - 带代码实现的论文 - SOTA 性能追踪 - 按任务分类 ### 核心功能 #### 8 个 MCP 工具 1. `search_latest_papers` - 多源论文搜索 2. `search_github_repos` - GitHub 仓库搜索 3. `get_daily_papers` - 每日精选论文 4. `get_trending_repos` - Trending 仓库 5. `get_trending_models` - 热门模型 6. `search_by_area` - 按领域搜索 7. `generate_daily_summary` - 每日汇总 8. `generate_weekly_summary` - 每周汇总 #### 2 个 MCP 资源 1. `ai-research://daily-summary` - 每日汇总(自动缓存) 2. `ai-research://weekly-summary` - 每周汇总(自动缓存) ### 覆盖的研究领域 ``` 核心 AI/ML ├── 大语言模型 (LLM) ├── Transformer 架构 ├── 多模态学习 ├── 生成式 AI (Diffusion, GAN) └── 深度学习基础 应用领域 ├── 计算机视觉 ├── 自然语言处理 ├── 语音处理 ├── 推荐系统 └── 时间序列分析 交叉学科 ├── 机器人学与具身智能 ├── 生物信息学 (蛋白质、药物) ├── AI for Science ├── 图神经网络 └── 强化学习 前沿方向 ├── 模型压缩与优化 ├── AI 安全与对齐 ├── 联邦学习 ├── 持续学习 └── 神经形态计算 ``` ## 项目文件 ### 源代码 (src/ai_research_mcp/) ``` server.py (458 行) ├── AIResearchServer 类 ├── 8 个工具处理函数 ├── 2 个资源提供函数 └── 结果格式化函数 data_sources/ ├── arxiv_client.py (152 行) │ └── ArxivClient - arXiv 论文搜索 ├── github_client.py (188 行) │ └── GithubClient - GitHub 仓库搜索 ├── huggingface_client.py (165 行) │ └── HuggingFaceClient - HF 论文和模型 └── papers_with_code_client.py (158 行) └── PapersWithCodeClient - PWC 论文搜索 utils/ └── cache.py (82 行) └── CacheManager - 文件缓存管理 ``` ### 文档 ``` README.md - 完整文档 (254 行) ├── 功能介绍 ├── 安装指南 ├── 配置说明 ├── 使用示例 └── API 文档 QUICKSTART.md - 快速开始 (80 行) ├── 5 分钟安装 ├── 配置示例 └── 基础使用 EXAMPLES.md - 使用示例 (250+ 行) ├── 各种查询示例 ├── 高级用法 └── 最佳实践 TROUBLESHOOTING.md - 故障排除 (300+ 行) ├── 常见问题 ├── 调试技巧 └── 错误解决方案 ``` ### 配置文件 ``` pyproject.toml - 项目配置 ├── 依赖声明 ├── 构建配置 └── 开发工具设置 claude_desktop_config.example.json - Claude Desktop 配置示例 .gitignore - Git 忽略规则 LICENSE - MIT 许可证 ``` ### 工具脚本 ``` test_clients.py - 数据源客户端测试脚本 └── 测试所有 4 个数据源的连接和功能 ``` ## 技术栈 ### 核心依赖 - **mcp** (>=0.9.0) - Model Context Protocol SDK - **arxiv** (>=2.1.0) - arXiv API 客户端 - **PyGithub** (>=2.1.1) - GitHub API 客户端 - **huggingface-hub** (>=0.20.0) - Hugging Face API - **requests** (>=2.31.0) - HTTP 请求库 ### Python 版本 - **要求**: Python 3.10+ - **推荐**: Python 3.11+ ## 性能优化 ### 缓存机制 ```python # 三层缓存策略 GitHub API: 1 小时缓存 arXiv 搜索: 2 小时缓存 每日汇总: 24 小时缓存 ``` ### API 速率管理 - GitHub: 支持 token 认证 (5000 req/h) - arXiv: 自动遵守 3 秒间隔 - Hugging Face: 无严格限制 - Papers with Code: 无严格限制 ## 使用统计 ### 预计 API 调用量 **每日汇总生成:** - arXiv: ~3 次 - GitHub: ~2 次 - Hugging Face: ~3 次 - Total: ~8 次 API 调用 **单次搜索:** - 1-3 次 API 调用(取决于数据源) ### 数据量 **每日汇总:** - ~30 篇论文 - ~20 个 GitHub 仓库 - ~15 个 Hugging Face 模型 **每周汇总:** - ~100 篇论文 - ~40 个仓库 - ~25 个模型 ## 部署要求 ### 最低要求 - Python 3.10+ - 500MB 磁盘空间 - 稳定的网络连接 - Claude Desktop (作为 MCP 客户端) ### 推荐配置 - Python 3.11+ - 1GB 磁盘空间 (包含缓存) - GitHub Personal Access Token - 良好的网络连接 ## 安全性 ### 数据处理 - ✅ 所有数据都从公开 API 获取 - ✅ 不收集用户个人信息 - ✅ 本地缓存,不上传数据 - ✅ GitHub Token 仅存储在本地配置 ### API Token - GitHub Token: 仅需 `public_repo` 权限 - 可选配置,不是必需的 ## 扩展性 ### 易于添加新数据源 ```python # 添加新客户端 class NewSourceClient: def search_papers(self, **kwargs): # 实现搜索逻辑 pass # 在 server.py 中集成 self.new_source = NewSourceClient() ``` ### 易于添加新工具 ```python # 定义新工具 Tool( name="new_tool", description="...", inputSchema={...} ) # 实现处理函数 async def _handle_new_tool(self, **args): # 实现逻辑 pass ``` ## 未来规划 ### 短期 (v0.2.0) - [ ] 添加 OpenReview 集成 - [ ] 支持自定义关键词订阅 - [ ] 优化缓存策略 - [ ] 添加更多测试 ### 中期 (v0.3.0) - [ ] 支持导出为 PDF/HTML - [ ] 添加可视化图表 - [ ] 邮件通知功能 - [ ] Web 界面 ### 长期 (v1.0.0) - [ ] 多语言支持 - [ ] 智能推荐算法 - [ ] 协作功能 - [ ] 移动端支持 ## 贡献指南 ### 代码规范 - 使用 Black 格式化代码 - 使用 Ruff 进行 linting - 遵循 PEP 8 规范 - 添加类型注解 ### 测试 ```bash # 运行客户端测试 python test_clients.py # 格式化代码 black src/ # Lint 检查 ruff check src/ ``` ## 许可证 MIT License - 开源免费使用 ## 致谢 感谢以下开源项目和 API 提供商: - arXiv API - GitHub API - Hugging Face Hub - Papers with Code - Anthropic MCP Protocol ## 联系方式 - 文档: 查看 README.md - 问题: 参考 TROUBLESHOOTING.md - 示例: 查看 EXAMPLES.md --- **版本**: v0.1.0 **发布日期**: 2025-10-27 **状态**: ✅ 生产就绪

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/nanyang12138/AI-Research-MCP'

If you have feedback or need assistance with the MCP directory API, please join our Discord server