Multi-Provider Image Generation Server

MULTI_API_SUMMARY.md•7.17 KiB

# 多API支持功能实现总结 ## 🎯 任务完成情况 ✅ **已完成**: 增加 GPT-4o 和豆包 API 接入，实现多 API 支持 ## 🏗️ 架构设计 ### 新增文件结构 ``` ├── api_providers/ # API提供者模块 │ ├── __init__.py # 模块初始化 │ ├── base.py # 抽象基类 │ ├── hunyuan_provider.py # 腾讯混元提供者 │ ├── openai_provider.py # OpenAI提供者 │ ├── doubao_provider.py # 豆包提供者 │ └── provider_manager.py # 提供者管理器 ├── mcp_image_server_multi.py # 多API MCP服务器 ├── test_multi_api_client.py # 测试客户端 ├── .env.example # 环境变量示例 ├── README-multi-api.md # 多API文档 ├── DEPLOYMENT_GUIDE.md # 部署指南 └── MULTI_API_SUMMARY.md # 本文档 ``` ### 核心组件 1. **BaseImageProvider** (基类) - 定义统一的API接口 - 提供参数验证方法 - 统一错误处理模式 2. **ProviderManager** (管理器) - 自动检测可用API - 智能提供者选择 - 统一的调用接口 3. **具体提供者实现** - HunyuanProvider: 腾讯混元API - OpenAIProvider: OpenAI DALL-E 3 API - DoubaoProvider: 豆包API ## 🔧 技术实现 ### 抽象化设计 ```python class BaseImageProvider(ABC): @abstractmethod async def generate_images(self, query, style, resolution, negative_prompt, **kwargs) @abstractmethod def get_available_styles(self) -> Dict[str, str] @abstractmethod def get_available_resolutions(self) -> Dict[str, str] @abstractmethod def get_provider_name(self) -> str ``` ### 智能提供者管理 ```python class ProviderManager: def __init__(self): self._initialize_providers() # 自动检测可用API async def generate_images(self, provider_name=None, **kwargs): provider = self.get_provider(provider_name) # 智能选择 return await provider.generate_images(**kwargs) ``` ### 参数格式支持 - **基础格式**: `style="realistic"`, `resolution="1024x1024"` - **提供者特定格式**: `style="hunyuan:shuimo"`, `resolution="openai:1024x1792"` - **混合使用**: `provider="doubao"`, `style="chinese_painting"` ## 🎨 支持的API提供者 | 提供者 | 风格数量 | 分辨率选项 | 特色功能 | |--------|----------|------------|----------| | **腾讯混元** | 18种 | 8种 | 中文优化，艺术风格丰富 | | **OpenAI DALL-E 3** | 12种 | 7种 | 高质量，英文优化 | | **豆包** | 12种 | 9种 | 平衡质量与速度 | ### 腾讯混元 API 特色 - 支持 18 种艺术风格（日漫、水墨画、油画等） - 中文提示词友好 - 支持负面提示词 - 8 种分辨率选项（正方形、横向、竖向） ### OpenAI DALL-E 3 特色 - 高质量图像输出 - 自动提示词优化 - 12 种风格选项 - 7 种分辨率（包括超高分辨率） ### 豆包 API 特色 - 字节跳动自研模型 - 平衡的质量和速度 - 12 种风格选项 - 9 种分辨率选项 ## 🔌 MCP 集成功能 ### 新增资源 - `providers://list` - 可用提供者列表 - `styles://list` - 所有提供者的风格 - `resolutions://list` - 所有提供者的分辨率 - `styles://provider/{name}` - 特定提供者风格 - `resolutions://provider/{name}` - 特定提供者分辨率 ### 增强的工具 - `generate_image` - 支持多提供者的图像生成 - 自动提供者选择 - 参数验证 - 错误处理 - 进度显示 ### 智能提示模板 - 动态显示可用提供者 - 实时风格和分辨率选项 - 使用示例和格式说明 ## 🚀 使用方式 ### 1. 基础使用 ```python # 自动选择提供者 generate_image(prompt="一只可爱的小猫") # 指定提供者 generate_image(prompt="A cute cat", provider="openai") ``` ### 2. 高级参数 ```python # 使用特定提供者的风格 generate_image( prompt="山水画", style="hunyuan:shuimo", resolution="hunyuan:1024:768" ) # 混合参数 generate_image( prompt="未来城市", provider="doubao", style="cyberpunk", resolution="1024x768", negative_prompt="low quality" ) ``` ### 3. Cursor IDE 集成在 Cursor 中自然语言调用： ``` "请用OpenAI生成一张cartoon风格的猫咪图片" "使用hunyuan:shuimo风格生成山水画" "用doubao生成1024x768的fantasy风格图片" ``` ## 🔍 配置和环境 ### 环境变量支持 ```env # 基础配置 MCP_IMAGE_SAVE_DIR=./generated_images # API密钥（选择性配置） TENCENT_SECRET_ID=your_id TENCENT_SECRET_KEY=your_key OPENAI_API_KEY=your_key DOUBAO_ACCESS_KEY=your_key DOUBAO_SECRET_KEY=your_key # 可选的自定义端点 OPENAI_BASE_URL=https://custom-endpoint.com DOUBAO_ENDPOINT=https://custom-endpoint.com ``` ### 智能配置检测 - 自动检测可用的API密钥 - 按优先级选择默认提供者 - 提供详细的配置状态信息 ## 📊 测试和质量保证 ### 测试客户端 `test_multi_api_client.py` 提供全面测试： - 提供者管理器功能测试 - 参数验证测试 - 模拟图像生成测试 - 错误处理测试 ### 测试覆盖 - ✅ 提供者初始化 - ✅ 参数验证 - ✅ 错误处理 - ✅ 格式转换 - ✅ 文件保存 ## 🛠️ 错误处理和降级 ### 智能错误处理 1. **提供者不可用**: 显示可用选项 2. **参数无效**: 提供正确格式示例 3. **API调用失败**: 详细错误信息和重试机制 4. **网络问题**: 超时处理和重试逻辑 ### 降级策略 - 优雅的错误信息 - 备选提供者建议 - 参数修正提示 ## 🔄 向后兼容性 ### 完全向后兼容 - 保留原有的 `mcp_image_server.py` - 新的多API服务为 `mcp_image_server_multi.py` - 原有参数格式继续支持 ### 迁移路径 - 无缝从单API升级到多API - 配置文件向前兼容 - 渐进式功能采用 ## 🚗 未来扩展 ### 易于扩展的架构添加新API提供者只需： 1. 创建新的 `Provider` 类继承 `BaseImageProvider` 2. 实现必要的抽象方法 3. 在 `ProviderManager` 中注册 4. 添加环境变量检测 ### 规划中的功能 - 阿里通义万相支持 - 百度文心一格支持 - Stable Diffusion API 支持 - 批量生成功能 - 图像编辑和修改功能 ## 📈 性能优化 ### 异步设计 - 全异步API调用 - 非阻塞的进度显示 - 并发控制和限流 ### 资源管理 - 智能连接池 - 内存优化 - 缓存机制 ## 🎉 总结本次实现成功完成了用户需求： 1. ✅ **GPT-4o API 接入** - 通过 OpenAI DALL-E 3 实现 2. ✅ **豆包 API 接入** - 字节跳动图像生成服务 3. ✅ **多 API 支持** - 统一管理，智能选择 4. ✅ **向后兼容** - 保持原有功能完整 5. ✅ **易于扩展** - 模块化设计，便于添加新API ### 关键成就 - **3个主流API提供者** 统一接入 - **50+种风格组合** 可供选择 - **智能参数解析** 支持多种格式 - **完整的错误处理** 和用户引导 - **全面的文档和示例** 用户现在可以在同一个MCP服务中使用腾讯混元、OpenAI和豆包三个图像生成API，享受更丰富的功能和更好的使用体验！ 🚀✨

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/ChristopheZhao/image-gen-mcp-server'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

MULTI_API_SUMMARY.md•7.17 KiB