🚀 快速入门
📋 先决条件
🔑 环境变量
💻 NPX 用法示例
🔌 与 MCP 客户端集成
🛠️ 在 MCP 客户端中设置
不同操作系统的示例配置
注意:对于 Windows 路径,请使用双反斜杠 (
\\
) 来转义 JSON 中的反斜杠字符。对于 Linux/macOS,请使用正斜杠 (/
)。
✨ 特点
💡 增强功能
🔄 工作原理
📁 输出目录行为
安装和使用
NPM 包
此软件包可在 npm 上获取: @cloudwerxlab/gpt-image-1-mcp
您可以全局安装它:
或者直接使用 npx 运行它,如快速入门部分所示。
工具: create_image
根据文本提示生成新图像。
参数
范围 | 类型 | 必需的 | 描述 |
| 细绳 | 是的 | 要生成的图像的文本描述(最多 32,000 个字符) |
| 细绳 | 不 | 图像尺寸:“1024x1024”(默认)、“1536x1024”或“1024x1536” |
| 细绳 | 不 | 图像质量:“高”(默认)、“中”或“低” |
| 整数 | 不 | 生成的图像数量(1-10,默认值:1) |
| 细绳 | 不 | 背景样式:“透明”、“不透明”或“自动”(默认) |
| 细绳 | 不 | 输出格式:“png”(默认)、“jpeg”或“webp” |
| 整数 | 不 | 压缩级别(0-100,默认值:0) |
| 细绳 | 不 | OpenAI 使用情况跟踪的用户标识符 |
| 细绳 | 不 | 审核级别:“低”或“自动”(默认) |
例子
回复
该工具返回:
包含所生成图像详细信息的格式化文本消息
以 base64 编码的数据格式显示图像
元数据包括令牌使用情况和文件路径
工具: create_image_edit
根据文本提示和可选掩码编辑现有图像。
参数
范围 | 类型 | 必需的 | 描述 |
| 字符串、对象或数组 | 是的 | 要编辑的图像(base64字符串或文件路径对象) |
| 细绳 | 是的 | 所需编辑的文本描述(最多 32,000 个字符) |
| 字符串或对象 | 不 | 定义要编辑的区域的掩码(base64字符串或文件路径对象) |
| 细绳 | 不 | 图像尺寸:“1024x1024”(默认)、“1536x1024”或“1024x1536” |
| 细绳 | 不 | 图像质量:“高”(默认)、“中”或“低” |
| 整数 | 不 | 生成的图像数量(1-10,默认值:1) |
| 细绳 | 不 | 背景样式:“透明”、“不透明”或“自动”(默认) |
| 细绳 | 不 | OpenAI 使用情况跟踪的用户标识符 |
Base64 编码图像示例
文件路径示例
回复
该工具返回:
包含已编辑图像详细信息的格式化文本消息
编辑后的图像作为 base64 编码数据
元数据包括令牌使用情况和文件路径
🔧 故障排除
🚨常见问题
🔍 错误处理和报告
MCP 服务器包含全面的错误处理功能,可在出现问题时提供详细信息。发生错误时:
错误格式:所有错误均返回:
清晰的错误信息,描述出了什么问题
具体的错误代码或类型
如果有关于错误的附加上下文
AI 助手行为:当此 MCP 服务器与 AI 助手一起使用时:
人工智能将始终报告完整的错误消息以帮助排除故障
人工智能将用通俗易懂的语言解释错误的可能原因
人工智能将建议解决问题的具体步骤
📄 许可证
🙏 致谢
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
模型上下文协议服务器,可使用 OpenAI 的 gpt-image-1 模型生成和编辑图像,从而允许 AI 助手根据文本提示创建和修改图像。
Related Resources
Related MCP Servers
- AsecurityFlicenseAqualityA Model Context Protocol server that provides image generation capabilities using the Ideogram API, allowing users to create images from text prompts with customizable parameters.Last updated -15
- -securityAlicense-qualityA server that provides AI-powered image generation, modification, and processing capabilities through the Model Context Protocol, leveraging Google Gemini models and other image services.Last updated -13MIT License
- -securityAlicense-qualityA Model Context Protocol server enabling AI assistants to generate images through OpenAI's DALL-E API with full support for all available options and fine-grained control.Last updated -61MIT License
- -securityAlicense-qualityProvides tools for generating and editing images using OpenAI's gpt-image-1 model via an MCP interface, enabling AI assistants to create and modify images based on text prompts.Last updated -16Apache 2.0