PROJECT_SUMMARY.md•7.32 kB
# AI Research MCP Server - 项目总结
## 项目概述
**AI Research MCP Server** 是一个基于 Model Context Protocol (MCP) 的服务器,用于追踪和获取最新的 AI/LLM 研究进展。
### 核心价值
解决研究者面临的信息滞后问题,让您能够:
- ⚡ 实时追踪最新的 AI 研究论文
- 🔥 发现热门的开源项目和代码实现
- 🤖 了解最新发布的模型和工具
- 📊 自动生成每日/每周研究汇总
## 技术实现
### 架构
```
AI Research MCP Server
├── MCP Protocol Layer (服务器接口)
├── Tool Handlers (8 个工具)
├── Resource Providers (2 个资源)
├── Data Source Clients (4 个客户端)
│ ├── arXiv Client
│ ├── GitHub Client
│ ├── Hugging Face Client
│ └── Papers with Code Client
└── Cache Manager (缓存优化)
```
### 数据源
1. **arXiv** - 学术论文预印本
- 15+ AI 相关类别
- 支持关键词和时间筛选
- 覆盖所有主流 AI 领域
2. **GitHub** - 开源代码仓库
- 智能搜索算法
- 追踪 trending 项目
- 按主题和语言过滤
3. **Hugging Face** - 模型和数据集平台
- 每日精选论文
- 热门模型追踪
- 数据集更新监控
4. **Papers with Code** - 论文+代码配对
- 带代码实现的论文
- SOTA 性能追踪
- 按任务分类
### 核心功能
#### 8 个 MCP 工具
1. `search_latest_papers` - 多源论文搜索
2. `search_github_repos` - GitHub 仓库搜索
3. `get_daily_papers` - 每日精选论文
4. `get_trending_repos` - Trending 仓库
5. `get_trending_models` - 热门模型
6. `search_by_area` - 按领域搜索
7. `generate_daily_summary` - 每日汇总
8. `generate_weekly_summary` - 每周汇总
#### 2 个 MCP 资源
1. `ai-research://daily-summary` - 每日汇总(自动缓存)
2. `ai-research://weekly-summary` - 每周汇总(自动缓存)
### 覆盖的研究领域
```
核心 AI/ML
├── 大语言模型 (LLM)
├── Transformer 架构
├── 多模态学习
├── 生成式 AI (Diffusion, GAN)
└── 深度学习基础
应用领域
├── 计算机视觉
├── 自然语言处理
├── 语音处理
├── 推荐系统
└── 时间序列分析
交叉学科
├── 机器人学与具身智能
├── 生物信息学 (蛋白质、药物)
├── AI for Science
├── 图神经网络
└── 强化学习
前沿方向
├── 模型压缩与优化
├── AI 安全与对齐
├── 联邦学习
├── 持续学习
└── 神经形态计算
```
## 项目文件
### 源代码 (src/ai_research_mcp/)
```
server.py (458 行)
├── AIResearchServer 类
├── 8 个工具处理函数
├── 2 个资源提供函数
└── 结果格式化函数
data_sources/
├── arxiv_client.py (152 行)
│ └── ArxivClient - arXiv 论文搜索
├── github_client.py (188 行)
│ └── GithubClient - GitHub 仓库搜索
├── huggingface_client.py (165 行)
│ └── HuggingFaceClient - HF 论文和模型
└── papers_with_code_client.py (158 行)
└── PapersWithCodeClient - PWC 论文搜索
utils/
└── cache.py (82 行)
└── CacheManager - 文件缓存管理
```
### 文档
```
README.md - 完整文档 (254 行)
├── 功能介绍
├── 安装指南
├── 配置说明
├── 使用示例
└── API 文档
QUICKSTART.md - 快速开始 (80 行)
├── 5 分钟安装
├── 配置示例
└── 基础使用
EXAMPLES.md - 使用示例 (250+ 行)
├── 各种查询示例
├── 高级用法
└── 最佳实践
TROUBLESHOOTING.md - 故障排除 (300+ 行)
├── 常见问题
├── 调试技巧
└── 错误解决方案
```
### 配置文件
```
pyproject.toml - 项目配置
├── 依赖声明
├── 构建配置
└── 开发工具设置
claude_desktop_config.example.json - Claude Desktop 配置示例
.gitignore - Git 忽略规则
LICENSE - MIT 许可证
```
### 工具脚本
```
test_clients.py - 数据源客户端测试脚本
└── 测试所有 4 个数据源的连接和功能
```
## 技术栈
### 核心依赖
- **mcp** (>=0.9.0) - Model Context Protocol SDK
- **arxiv** (>=2.1.0) - arXiv API 客户端
- **PyGithub** (>=2.1.1) - GitHub API 客户端
- **huggingface-hub** (>=0.20.0) - Hugging Face API
- **requests** (>=2.31.0) - HTTP 请求库
### Python 版本
- **要求**: Python 3.10+
- **推荐**: Python 3.11+
## 性能优化
### 缓存机制
```python
# 三层缓存策略
GitHub API: 1 小时缓存
arXiv 搜索: 2 小时缓存
每日汇总: 24 小时缓存
```
### API 速率管理
- GitHub: 支持 token 认证 (5000 req/h)
- arXiv: 自动遵守 3 秒间隔
- Hugging Face: 无严格限制
- Papers with Code: 无严格限制
## 使用统计
### 预计 API 调用量
**每日汇总生成:**
- arXiv: ~3 次
- GitHub: ~2 次
- Hugging Face: ~3 次
- Total: ~8 次 API 调用
**单次搜索:**
- 1-3 次 API 调用(取决于数据源)
### 数据量
**每日汇总:**
- ~30 篇论文
- ~20 个 GitHub 仓库
- ~15 个 Hugging Face 模型
**每周汇总:**
- ~100 篇论文
- ~40 个仓库
- ~25 个模型
## 部署要求
### 最低要求
- Python 3.10+
- 500MB 磁盘空间
- 稳定的网络连接
- Claude Desktop (作为 MCP 客户端)
### 推荐配置
- Python 3.11+
- 1GB 磁盘空间 (包含缓存)
- GitHub Personal Access Token
- 良好的网络连接
## 安全性
### 数据处理
- ✅ 所有数据都从公开 API 获取
- ✅ 不收集用户个人信息
- ✅ 本地缓存,不上传数据
- ✅ GitHub Token 仅存储在本地配置
### API Token
- GitHub Token: 仅需 `public_repo` 权限
- 可选配置,不是必需的
## 扩展性
### 易于添加新数据源
```python
# 添加新客户端
class NewSourceClient:
def search_papers(self, **kwargs):
# 实现搜索逻辑
pass
# 在 server.py 中集成
self.new_source = NewSourceClient()
```
### 易于添加新工具
```python
# 定义新工具
Tool(
name="new_tool",
description="...",
inputSchema={...}
)
# 实现处理函数
async def _handle_new_tool(self, **args):
# 实现逻辑
pass
```
## 未来规划
### 短期 (v0.2.0)
- [ ] 添加 OpenReview 集成
- [ ] 支持自定义关键词订阅
- [ ] 优化缓存策略
- [ ] 添加更多测试
### 中期 (v0.3.0)
- [ ] 支持导出为 PDF/HTML
- [ ] 添加可视化图表
- [ ] 邮件通知功能
- [ ] Web 界面
### 长期 (v1.0.0)
- [ ] 多语言支持
- [ ] 智能推荐算法
- [ ] 协作功能
- [ ] 移动端支持
## 贡献指南
### 代码规范
- 使用 Black 格式化代码
- 使用 Ruff 进行 linting
- 遵循 PEP 8 规范
- 添加类型注解
### 测试
```bash
# 运行客户端测试
python test_clients.py
# 格式化代码
black src/
# Lint 检查
ruff check src/
```
## 许可证
MIT License - 开源免费使用
## 致谢
感谢以下开源项目和 API 提供商:
- arXiv API
- GitHub API
- Hugging Face Hub
- Papers with Code
- Anthropic MCP Protocol
## 联系方式
- 文档: 查看 README.md
- 问题: 参考 TROUBLESHOOTING.md
- 示例: 查看 EXAMPLES.md
---
**版本**: v0.1.0
**发布日期**: 2025-10-27
**状态**: ✅ 生产就绪