local-only server
The server can only run on the client’s local machine because it depends on local resources.
Integrations
Supports environment variable configuration through .env files for storing API keys and output path settings.
Enables text-to-image generation and image transformation using Google's Gemini AI model, supporting high-resolution image creation from text prompts and modification of existing images based on textual descriptions.
Includes specific configuration paths for macOS users to set up the MCP server with Claude Desktop.
Gemini 图像生成器 MCP 服务器
通过 MCP 协议使用 Google 的 Gemini 模型从文本提示生成高质量的图像。
概述
这款 MCP 服务器允许任何 AI 助手使用 Google 的 Gemini AI 模型生成图像。该服务器负责处理快速工程、文本转图像、文件名生成以及本地图像存储,让您能够通过任何 MCP 客户端轻松创建和管理 AI 生成的图像。
特征
- 使用 Gemini 2.0 Flash 进行文本到图像的生成
- 基于文本提示的图像到图像转换
- 支持基于文件和 base64 编码的图像
- 根据提示自动智能生成文件名
- 非英语提示的自动翻译
- 可配置输出路径的本地图像存储
- 生成的图像中严格排除文本
- 高分辨率图像输出
- 直接访问图像数据和文件路径
可用的 MCP 工具
该服务器为AI助手提供了以下MCP工具:
1. generate_image_from_text
根据文本提示描述创建新图像。
参数:
prompt
:要生成的图像的文本描述
返回:
- 包含以下内容的元组:
- 原始图像数据(字节)
- 保存的图像文件的路径(str)
这种双重返回格式允许 AI 助手直接处理图像数据或引用保存的文件路径。
例子:
- “生成山上日落的图像”
- “在科幻城市中创造一只逼真的飞猪”
示例输出
该图像是使用提示生成的:
一只戴着高顶礼帽、长着翅膀的 3D 渲染猪,飞过一座充满绿意的未来科幻城市
已知问题
将此 MCP 服务器与 Claude Desktop Host 一起使用时:
- 性能问题:与其他方法相比,使用
transform_image_from_encoded
处理时间可能会显著延长。这是由于通过 MCP 协议传输大量 base64 编码的图像数据会产生开销。 - 路径解析问题:使用 Claude Desktop Host 时,可能无法正确解析图像路径。主机应用程序可能无法正确解释返回的文件路径,从而导致难以访问生成的图像。
为了获得最佳体验,请考虑在可能的情况下使用替代 MCP 客户端或transform_image_from_file
方法。
2. transform_image_from_encoded
使用 base64 编码的图像数据根据文本提示转换现有图像。
参数:
encoded_image
:带有格式标头的 Base64 编码图像数据(必须采用以下格式:“data:image/[format];base64,[data]”)prompt
:关于如何转换图像的文本描述
返回:
- 包含以下内容的元组:
- 原始转换图像数据(字节)
- 已保存的转换图像文件的路径(str)
例子:
- “给这片风景添加雪景”
- “将背景改为海滩”
3. transform_image_from_file
根据文本提示转换现有的图像文件。
参数:
image_file_path
:要转换的图像文件的路径prompt
:关于如何转换图像的文本描述
返回:
- 包含以下内容的元组:
- 原始转换图像数据(字节)
- 已保存的转换图像文件的路径(str)
例子:
- “在此图像中的人物旁边添加一只骆驼”
- “让白天的场景看起来像夜晚”
示例转换
使用上面创建的飞猪图像,我们根据以下提示应用了变换:
前:
后:
原始的飞猪图像加上一只可爱的小鲸鱼在它旁边飞翔
设置
先决条件
- Python 3.11+
- Google AI API 密钥(Gemini)
- MCP 主机应用程序(Claude Desktop App、Cursor 或其他 MCP 兼容客户端)
获取 Gemini API 密钥
- 访问Google AI Studio API 密钥页面
- 使用您的 Google 帐户登录
- 点击“创建 API 密钥”
- 复制新的 API 密钥以用于配置
- 注意:API 密钥每月提供一定额度的免费使用。您可以在 Google AI Studio 中查看使用情况。
安装
- 克隆存储库:
- 创建虚拟环境并安装依赖项:
- 复制示例环境文件并添加您的 API 密钥:
- 编辑
.env
文件以包含您的 Google Gemini API 密钥和首选输出路径:
配置 Claude 桌面
将以下内容添加到您的claude_desktop_config.json
中:
- macOS :
~/Library/Application Support/Claude/claude_desktop_config.json
用法
安装并配置完成后,您可以要求 Claude 使用以下提示生成或转换图像:
生成新图像
- “生成山上日落的图像”
- “创作一幅未来城市景观的插画”
- “画一张戴着太阳镜的猫的照片”
转换现有图像
- “通过在场景中添加雪来改变这幅图像”
- “编辑这张照片,让它看起来像是在晚上拍摄的”
- “在这张图片的背景中添加一条飞翔的龙”
生成/转换后的图像将保存到您配置的输出路径,并在 Claude 中显示。通过更新的返回类型,AI 助手还可以直接处理图像数据,而无需访问已保存的文件。
测试
您可以通过运行 FastMCP 开发服务器来测试该应用程序:
此命令启动本地开发服务器,并通过http://localhost:5173/访问 MCP Inspector。MCP Inspector 提供了一个便捷的 Web 界面,您可以直接在其中测试图像生成工具,而无需使用 Claude 或其他 MCP 客户端。您可以输入文本提示,执行工具并立即查看结果,这对于开发和调试非常有帮助。
执照
MIT 许可证
This server cannot be installed
允许 AI 助手通过 MCP 协议使用 Google 的 Gemini 模型从文本提示生成和转换高质量图像。