Enables high-quality image generation and editing using Google's Gemini 2.0 Flash model, supporting text-to-image generation, image transformation with text prompts, and multi-language prompt optimization
Gemini 画像生成器 MCP サーバー (修正版)
Claude DesktopでGoogle の Gemini AIを使用して高品質な画像を生成・編集できる MCP サーバーです。
🚀 主な特徴
- テキストから画像生成: Gemini 2.0 Flash を使用したテキスト→画像変換
- 画像変換: 既存の画像をテキストプロンプトで修正
- 多言語対応: 日本語・韓国語・中国語プロンプトの自動英語翻訳・最適化
- AI ファイル名生成: プロンプト基準でファイル名を自動生成
- ローカル保存: 生成された画像を指定フォルダに自動保存
- Claude チャット内表示: 生成された画像をチャット画面で直接確認
🛠️ インストール要件
- Python 3.11 以上
- Google Gemini API キー
- Claude Desktop またはその他 MCP 互換クライアント
📋 ステップ1: Gemini API キー発行
- Google AI Studio API Keys ページ にアクセス
- Google アカウントでログイン
- "Create API Key" をクリック
- 生成された API キーをコピー(後で使用)
💾 ステップ2: MCP サーバーインストール
自動インストール(推奨)
インストール確認
Starting Gemini Image Generator MCP server...
メッセージが表示されれば成功!(Ctrl+CまたはCtrl+Z で終了)
⚙️ ステップ3: Claude Desktop 設定
設定ファイル場所
- macOS:
~/Library/Application Support/Claude/claude_desktop_config.json
- Windows:
%APPDATA%\Claude\claude_desktop_config.json
設定ファイル内容
実際の設定例
スクリプト命令を使用する場合(簡単設定)
※ この方法は args
指定が不要でより簡潔です
🚨 重要事項
- 絶対パス使用: すべてのパスは完全パスで入力
- API キー置換:
ここに実際のAPIキーを入力
部分を発行した実際のキーに置換 - 画像フォルダ:
OUTPUT_IMAGE_PATH
に指定したフォルダが事前に作成されている必要があります
画像保存フォルダ作成
🎯 ステップ4: 実行・テスト
- Claude Desktop 再起動: 設定後完全に終了して再起動
- 接続確認: Claude Desktop で MCP サーバーが接続されたか確認
- テスト: 「猫の絵を描いて」とリクエストしてみる
📖 使用方法
画像生成
画像変換(ファイルパス)
画像変換(アップロード)
画像を Claude にアップロード後:
🔧 トラブルシューティング
サーバー接続失敗
- ログ確認: Claude Desktop のログフォルダで
gemini-image-generator.log
を確認 - パス確認:
claude_desktop_config.json
の Python パスが正確か確認 - 権限確認: 画像保存フォルダに書き込み権限があるか確認
API キーエラー
- キー有効性: Google AI Studio で API キーが有効化されているか確認
- 引用符確認: 設定ファイルで API キーが引用符で囲まれているか確認
手動テスト
📊 提供ツール
1. generate_image_from_text
- 機能: テキストプロンプトで新しい画像生成
- 入力: 画像説明テキスト
- 出力: 生成された画像(Claude チャット内表示 + ローカル保存)
2. transform_image_from_file
- 機能: ファイルパスの画像をテキストプロンプトで変換
- 入力: 画像ファイルパス、変換プロンプト
- 出力: 変換された画像(Claude チャット内表示 + ローカル保存)
3. transform_image_from_encoded
- 機能: Base64 エンコードされた画像をテキストプロンプトで変換
- 入力: Base64 画像データ、変換プロンプト
- 出力: 変換された画像(Claude チャット内表示 + ローカル保存)
📝 オリジナルからの相違点
この修正版は元のリポジトリの以下の問題を解決しました:
- ❌ 元の問題: JSON シリアル化エラー (
invalid utf-8 sequence
) - ❌ 元の問題: MCP ツールがバイナリデータ返却により実行失敗
- ✅ 修正事項: ファイルパス返却で安定的な動作
- ✅ 修正事項: Claude Desktop で完璧に動作
- ✅ 修正事項: 生成された画像を Claude チャット内で直接確認可能
🤝 貢献・お問い合わせ
- 元のリポジトリ: qhdrl12/mcp-server-gemini-image-generator
- 修正版: sungmin-koo-ai/GeminiImageMCP
- 問題報告: GitHub Issues タブで問題を報告
📄 ライセンス
MIT License - 元のプロジェクトと同じ
ヒント: 初回設定時はステップごとに進め、問題が発生した場合はまずログファイルを確認してください! 🚀
local-only server
The server can only run on the client's local machine because it depends on local resources.
Enables Claude Desktop users to generate and edit high-quality images using Google's Gemini AI. Supports text-to-image generation, image transformations with text prompts, and automatic local saving with multilingual support.
Related MCP Servers
- AsecurityAlicenseAqualityA TypeScript server that integrates Google's Gemini Pro model with Claude Desktop through the Model Context Protocol, allowing Claude users to access Gemini's text generation capabilities.Last updated -3812MIT License
- AsecurityAlicenseAqualityA server that enables Claude Desktop to generate images using Google's Gemini AI models through the Model Context Protocol (MCP).Last updated -83814MIT License
- -securityFlicense-qualityA Model Context Protocol server that enables Claude Desktop to interact with Google's Gemini 2.5 Pro Experimental AI model, with features like Google Search integration and token usage reporting.Last updated -3
- -securityAlicense-qualityConnects Claude Code with Google's Gemini AI, allowing users to ask Gemini questions, get code reviews, and brainstorm ideas directly within Claude Code.Last updated -222MIT License