Source code repository hosting with automated CI/CD workflows for code quality checks and PyPI publishing
Python package distribution platform where the protein-mcp server is published and can be installed via pip or uvx
蛋白质数据访问服务器 (Protein MCP Server)
🧬 基于 FastMCP 的蛋白质数据访问服务器,为生物信息学研究提供强大的蛋白质结构数据查询、获取和下载功能。
🎯 项目特色
✅ 工具精简优化 - 从8个工具优化为3个核心工具,减少62.5%复杂度 ✅ 功能完整保留 - 所有原有功能完整保留,无功能损失 ✅ 用户体验大幅提升 - 工具职责更清晰,学习成本更低 ✅ 代码质量优化 - 代码量减少39.2%,维护性显著提升 ✅ 多协议支持 - 支持stdio、http、sse三种传输协议
🚀 快速开始
方式一:uvx直接运行(推荐)
方式二:从PyPI安装
方式三:开发环境设置
🛠️ 核心功能工具
1. 蛋白质结构搜索工具
智能搜索 - 支持多种搜索方式的蛋白质结构发现
2. 蛋白质数据获取工具
综合数据 - 一次性获取完整的蛋白质信息包
3. 蛋白质结构文件下载工具
文件管理 - 下载和管理各种格式的蛋白质结构文件
🌐 MCP客户端集成使用指南
Claude Desktop 集成
手动配置方式
步骤1:使用Claude Code的slash命令
步骤2:创建Claude Code配置文件
创建或编辑文件:~/.claude/mcp.json
Claude Desktop 配置
创建或编辑 ~/.claude/mcp.json:
CodeX 配置
安装并添加MCP服务器:
创建 ~/.codex/mcp.json:
高级配置选项
如需自定义参数,可扩展配置:
Claude Desktop 高级配置:
CodeX 高级配置:
使用方法
启动Claude Code后,您可以直接在对话中:
语音/文字输入:
用户:帮我搜索与癌症相关的激酶蛋白质结构 Claude:正在调用find_protein_structures工具,搜索癌症激酶相关蛋白质...自动工具调用:Claude会根据您的需求自动选择合适的工具
实时数据获取:支持蛋白质结构搜索、序列分析、文件下载等操作
高级配置选项
CodeX 集成
安装和配置
步骤1:安装MCP服务器到CodeX
步骤2:创建CodeX配置文件
创建或编辑文件:~/.codex/mcp.json
使用方式
启动CodeX后,在代码编辑器中:
智能代码提示:CodeX会根据上下文自动提示相关的蛋白质分析
工具快速调用:通过注释或特殊命令快速调用MCP工具
工作区集成:自动创建蛋白质研究工作区
CodeX专用配置
通用编程集成
方式1:Python客户端直接调用
方式2:HTTP REST API集成
方式3:直接导入Python模块
环境变量配置详解
基础配置
高级配置
开发调试配置
🏗️ 项目架构
🔧 技术架构
核心技术栈
FastMCP框架 - 现代化的MCP服务器实现
RCSB PDB API - 权威的蛋白质结构数据库
Python 3.10+ - 现代Python特性和类型注解
异步编程 - 高并发性能的网络请求处理
多传输协议 - stdio、http、sse全支持
数据处理流程
智能API路由 - 根据请求类型自动选择最佳数据源
混合数据获取 - API + PDB文件解析的双重保障
自动降级机制 - API失败时无缝切换到文件解析
缓存优化 - 智能缓存减少重复请求
安全和性能
SSL证书验证 - 所有HTTPS连接强制SSL验证
请求超时控制 - 可配置的网络请求超时
内存优化 - 流式处理大文件,降低内存占用
错误恢复 - 完善的错误处理和重试机制
📊 性能指标
基准测试结果
搜索响应时间:< 2秒(基本搜索)
数据获取时间:2-6秒(完整蛋白质信息)
文件下载速度:1-10MB/秒(取决于网络和文件大小)
并发处理能力:支持最多10个并发请求
内存使用效率:处理大PDB文件时内存占用< 200MB
可靠性指标
API成功率:> 95%(在正常网络条件下)
数据完整性:100%文件校验和错误检测
服务可用性:7×24小时服务稳定性
自动恢复能力:网络中断后自动重连和重试
🧪 测试体系
测试覆盖
测试分类
单元测试 - 每个工具函数的独立测试
集成测试 - 多工具协作的端到端测试
性能测试 - 响应时间和资源使用测试
兼容性测试 - 不同Python版本和平台兼容性
🔧 开发指南
本地开发设置
代码质量规范
贡献流程
Fork仓库 - 在GitHub上fork项目
创建功能分支 -
git checkout -b feature/your-feature开发和测试 - 确保所有测试通过
提交代码 -
git commit -m 'feat: add your feature'推送分支 -
git push origin feature/your-feature创建Pull Request - 在GitHub上创建PR
提交信息规范
feat: 新功能
fix: 错误修复
docs: 文档更新
style: 代码格式化
refactor: 代码重构
test: 测试相关
chore: 构建工具、依赖更新等
📦 构建和发布
本地构建
发布流程
版本管理
📚 API文档
工具列表
工具名称 | 功能描述 | 主要参数 |
| 蛋白质结构搜索 | keywords, category, pdb_id, max_results |
| 蛋白质数据获取 | pdb_id, data_types, chain_id |
| 结构文件下载 | pdb_id, file_format, save_local |
参数说明
搜索参数:
keywords: 关键词搜索(支持中英文)category: 分类筛选(如:酶抑制剂、膜蛋白等)pdb_id: 精确PDB ID查找max_results: 最大返回结果数量(默认10)
数据类型:
basic: 基本信息(标题、作者、分辨率等)sequence: 氨基酸序列信息structure: 二级结构和配体信息all: 包含所有数据类型
文件格式:
pdb: 标准PDB格式(推荐,人类可读)mmcif: 大分子晶体信息文件(现代标准)mmtf: 高性能二进制格式(最快下载)
🌟 支持和社区
获取帮助
GitHub Issues: https://github.com/gqy20/protein-mcp/issues
许可证
MIT License - 详见 LICENSE 文件
🧬 Protein MCP Server - 为生物信息学研究提供专业、高效的蛋白质数据访问服务!
蛋白质,让研究更简单! 🎉
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Enables searching, retrieving, and downloading protein structure data from the RCSB Protein Data Bank. Supports intelligent protein structure search, comprehensive data retrieval, and multiple file format downloads for bioinformatics research.