This server enables image generation and transformation using Google's Gemini AI, integrated with Claude Desktop or other MCP-compatible clients.
Text-to-image generation: Create new images from text prompts using Gemini 2.0 Flash
Image transformation from file: Modify existing images by providing a local file path and a text prompt describing the desired changes
Image transformation from Base64 data: Edit images provided as Base64-encoded data (e.g.,
data:image/png;base64,...) using a transformation promptMultilingual support: Automatically translates and optimizes Japanese, Korean, and Chinese prompts into English for better results
AI-generated filenames: Automatically generates meaningful filenames based on the prompt used
Local storage: All generated/transformed images are automatically saved to a designated local folder
In-chat display: View generated or transformed images directly within the Claude Desktop chat interface
Enables high-quality image generation and editing using Google's Gemini 2.0 Flash model, supporting text-to-image generation, image transformation with text prompts, and multi-language prompt optimization
Click on "Install Server".
Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state.
In the chat, type
@followed by the MCP server name and your instructions, e.g., "@Gemini Image Generator MCPcreate a cute cat illustration with a hat"
That's it! The server will respond to your query, and you can continue using it as needed.
Here is a step-by-step guide with screenshots.
Gemini 画像生成器 MCP サーバー (修正版)
Claude DesktopでGoogle の Gemini AIを使用して高品質な画像を生成・編集できる MCP サーバーです。
🚀 主な特徴
テキストから画像生成: Gemini 2.0 Flash を使用したテキスト→画像変換
画像変換: 既存の画像をテキストプロンプトで修正
多言語対応: 日本語・韓国語・中国語プロンプトの自動英語翻訳・最適化
AI ファイル名生成: プロンプト基準でファイル名を自動生成
ローカル保存: 生成された画像を指定フォルダに自動保存
Claude チャット内表示: 生成された画像をチャット画面で直接確認
Related MCP server: Gemini MCP Server for Claude Desktop
🛠️ インストール要件
Python 3.11 以上
Google Gemini API キー
Claude Desktop またはその他 MCP 互換クライアント
📋 ステップ1: Gemini API キー発行
Google アカウントでログイン
"Create API Key" をクリック
生成された API キーをコピー(後で使用)
💾 ステップ2: MCP サーバーインストール
自動インストール(推奨)
# リポジトリクローン
git clone https://github.com/sungmin-koo-ai/GeminiImageMCP.git
cd GeminiImageMCP
# 仮想環境作成・有効化
python3 -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# パッケージインストール
pip install -e .インストール確認
# サーバーが正常実行されるかテスト
python -m gemini_image_mcp.serverStarting Gemini Image Generator MCP server... メッセージが表示されれば成功!(Ctrl+CまたはCtrl+Z で終了)
⚙️ ステップ3: Claude Desktop 設定
設定ファイル場所
macOS:
~/Library/Application Support/Claude/claude_desktop_config.jsonWindows:
%APPDATA%\Claude\claude_desktop_config.json
設定ファイル内容
{
"mcpServers": {
"gemini-image-generator": {
"command": "/Users/ユーザー名/GeminiImageMCP/venv/bin/python",
"args": [
"-m", "gemini_image_mcp.server"
],
"env": {
"GEMINI_API_KEY": "ここに実際のAPIキーを入力",
"OUTPUT_IMAGE_PATH": "/Users/ユーザー名/Pictures/ai_generated"
}
}
}
}実際の設定例
{
"mcpServers": {
"gemini-image-generator": {
"command": "/Users/ユーザー名/GeminiImageMCP/venv/bin/python",
"args": [
"-m", "gemini_image_mcp.server"
],
"env": {
"GEMINI_API_KEY": "AIzaSy...(実際のAPIキー)",
"OUTPUT_IMAGE_PATH": "/Users/ユーザー名/Pictures/ai_generated"
}
}
}
}スクリプト命令を使用する場合(簡単設定)
{
"mcpServers": {
"gemini-image-generator": {
"command": "/Users/ユーザー名/GeminiImageMCP/venv/bin/gemini-image-mcp",
"env": {
"GEMINI_API_KEY": "AIzaSy...(実際のAPIキー)",
"OUTPUT_IMAGE_PATH": "/Users/ユーザー名/Pictures/ai_generated"
}
}
}
}※ この方法は args 指定が不要でより簡潔です
🚨 重要事項
絶対パス使用: すべてのパスは完全パスで入力
API キー置換:
ここに実際のAPIキーを入力部分を発行した実際のキーに置換画像フォルダ:
OUTPUT_IMAGE_PATHに指定したフォルダが事前に作成されている必要があります
画像保存フォルダ作成
mkdir -p ~/Pictures/ai_generated🎯 ステップ4: 実行・テスト
Claude Desktop 再起動: 設定後完全に終了して再起動
接続確認: Claude Desktop で MCP サーバーが接続されたか確認
テスト: 「猫の絵を描いて」とリクエストしてみる
📖 使用方法
画像生成
東京タワーの可愛いイラストを描いて画像変換(ファイルパス)
/Users/username/image.jpg この画像に虹を追加して画像変換(アップロード)
画像を Claude にアップロード後:
背景をレインボーブリッジの夜景にしてくれ🔧 トラブルシューティング
サーバー接続失敗
ログ確認: Claude Desktop のログフォルダで
gemini-image-generator.logを確認パス確認:
claude_desktop_config.jsonの Python パスが正確か確認権限確認: 画像保存フォルダに書き込み権限があるか確認
API キーエラー
キー有効性: Google AI Studio で API キーが有効化されているか確認
引用符確認: 設定ファイルで API キーが引用符で囲まれているか確認
手動テスト
cd ~/GeminiImageMCP
source venv/bin/activate
export GEMINI_API_KEY="実際のAPIキー"
export OUTPUT_IMAGE_PATH="~/Pictures/ai_generated"
python -m gemini_image_mcp.server📊 提供ツール
1. generate_image_from_text
機能: テキストプロンプトで新しい画像生成
入力: 画像説明テキスト
出力: 生成された画像(Claude チャット内表示 + ローカル保存)
2. transform_image_from_file
機能: ファイルパスの画像をテキストプロンプトで変換
入力: 画像ファイルパス、変換プロンプト
出力: 変換された画像(Claude チャット内表示 + ローカル保存)
3. transform_image_from_encoded
機能: Base64 エンコードされた画像をテキストプロンプトで変換
入力: Base64 画像データ、変換プロンプト
出力: 変換された画像(Claude チャット内表示 + ローカル保存)
📝 オリジナルからの相違点
この修正版は元のリポジトリの以下の問題を解決しました:
❌ 元の問題: JSON シリアル化エラー (
invalid utf-8 sequence)❌ 元の問題: MCP ツールがバイナリデータ返却により実行失敗
✅ 修正事項: ファイルパス返却で安定的な動作
✅ 修正事項: Claude Desktop で完璧に動作
✅ 修正事項: 生成された画像を Claude チャット内で直接確認可能
🤝 貢献・お問い合わせ
問題報告: GitHub Issues タブで問題を報告
📄 ライセンス
MIT License - 元のプロジェクトと同じ
ヒント: 初回設定時はステップごとに進め、問題が発生した場合はまずログファイルを確認してください! 🚀