Spark EventLog MCP Server
基于 FastMCP 2.0 和 FastAPI 的 Spark 事件日志分析 MCP 服务器,提供全面的性能分析、资源监控和优化建议。
特性
🌐 FastMCP & FastAPI API: FastAPI&FastMCP提供的MCP支持和分析报告API
📊 性能分析: Shuffle 分析、资源利用率监控、任务执行分析
📈 可视化报告: 自动生成交互式 HTML 报告,支持浏览器直接访问
☁️ 多数据源: 支持 S3、HTTP URL、本地文件
💡 智能优化: 基于分析结果的自动优化建议
快速开始
MCP 客户端集成
stdio 模式 (推荐用于本地开发)
HTTP 模式
1. 启动 HTTP 服务器:
2. 配置 Remote MCP:
3. 服务启动后可访问:
API 文档: http://localhost:7799/docs
MCP 端点: http://localhost:7799/mcp
项目结构
MCP 工具
工具名称 | 功能描述 |
| 解析事件日志 (S3/URL/本地) |
| 执行性能分析 |
| 生成可视化报告 |
| 获取优化建议 |
| 查询当前分析状态 |
| 清除会话缓存 |
RESTful API 端点
基础端点
GET /- 服务信息GET /health- 健康检查GET /docs- API 文档 (Swagger UI)
报告管理
GET /api/reports- 列出所有报告GET /api/reports/{filename}- 查看 HTML 报告GET /reports/{filename}- 直接访问报告文件DELETE /api/reports/{filename}- 删除报告
MCP 工具调用
POST /mcp- MCP 协议端点
配置说明
环境变量
日志格式
日志包含详细的调试信息:
格式: 时间戳 - 级别 - [文件名:行号:函数名] - Logger名 - 消息
数据源支持
S3
HTTP URL
本地文件
报告示例
生成的 HTML 报告包含:
📊 应用概览 (任务数、成功率、持续时间)
💻 Executor 资源使用分布
🔄 Shuffle 性能分析
⚖️ 数据倾斜检测
💡 智能优化建议
📈 交互式可视化图表
故障排查
端口被占用
依赖包未安装
AWS 凭证问题
日志调试
技术栈
FastMCP 2.0: MCP 协议支持
FastAPI: RESTful API 框架
Pydantic: 数据验证和序列化
Plotly: 交互式图表
boto3: AWS S3 集成
aiofiles: 异步文件操作
开发
支持
文档: 查看
/docsAPI 文档问题: 提交 GitHub Issue
参考: FastMCP 文档