Skip to main content
Glama

Gemini Image Generator MCP

Gemini 画像生成器 MCP サーバー (修正版)

Claude DesktopでGoogle の Gemini AIを使用して高品質な画像を生成・編集できる MCP サーバーです。

🚀 主な特徴

  • テキストから画像生成: Gemini 2.0 Flash を使用したテキスト→画像変換
  • 画像変換: 既存の画像をテキストプロンプトで修正
  • 多言語対応: 日本語・韓国語・中国語プロンプトの自動英語翻訳・最適化
  • AI ファイル名生成: プロンプト基準でファイル名を自動生成
  • ローカル保存: 生成された画像を指定フォルダに自動保存
  • Claude チャット内表示: 生成された画像をチャット画面で直接確認

🛠️ インストール要件

  • Python 3.11 以上
  • Google Gemini API キー
  • Claude Desktop またはその他 MCP 互換クライアント

📋 ステップ1: Gemini API キー発行

  1. Google AI Studio API Keys ページ にアクセス
  2. Google アカウントでログイン
  3. "Create API Key" をクリック
  4. 生成された API キーをコピー(後で使用)

💾 ステップ2: MCP サーバーインストール

自動インストール(推奨)

# リポジトリクローン git clone https://github.com/sungmin-koo-ai/GeminiImageMCP.git cd GeminiImageMCP # 仮想環境作成・有効化 python3 -m venv venv source venv/bin/activate # Windows: venv\Scripts\activate # パッケージインストール pip install -e .

インストール確認

# サーバーが正常実行されるかテスト python -m gemini_image_mcp.server

Starting Gemini Image Generator MCP server... メッセージが表示されれば成功!(Ctrl+CまたはCtrl+Z で終了)

⚙️ ステップ3: Claude Desktop 設定

設定ファイル場所

  • macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
  • Windows: %APPDATA%\Claude\claude_desktop_config.json

設定ファイル内容

{ "mcpServers": { "gemini-image-generator": { "command": "/Users/ユーザー名/GeminiImageMCP/venv/bin/python", "args": [ "-m", "gemini_image_mcp.server" ], "env": { "GEMINI_API_KEY": "ここに実際のAPIキーを入力", "OUTPUT_IMAGE_PATH": "/Users/ユーザー名/Pictures/ai_generated" } } } }

実際の設定例

{ "mcpServers": { "gemini-image-generator": { "command": "/Users/ユーザー名/GeminiImageMCP/venv/bin/python", "args": [ "-m", "gemini_image_mcp.server" ], "env": { "GEMINI_API_KEY": "AIzaSy...(実際のAPIキー)", "OUTPUT_IMAGE_PATH": "/Users/ユーザー名/Pictures/ai_generated" } } } }

スクリプト命令を使用する場合(簡単設定)

{ "mcpServers": { "gemini-image-generator": { "command": "/Users/ユーザー名/GeminiImageMCP/venv/bin/gemini-image-mcp", "env": { "GEMINI_API_KEY": "AIzaSy...(実際のAPIキー)", "OUTPUT_IMAGE_PATH": "/Users/ユーザー名/Pictures/ai_generated" } } } }

※ この方法は args 指定が不要でより簡潔です

🚨 重要事項

  1. 絶対パス使用: すべてのパスは完全パスで入力
  2. API キー置換: ここに実際のAPIキーを入力 部分を発行した実際のキーに置換
  3. 画像フォルダ: OUTPUT_IMAGE_PATH に指定したフォルダが事前に作成されている必要があります

画像保存フォルダ作成

mkdir -p ~/Pictures/ai_generated

🎯 ステップ4: 実行・テスト

  1. Claude Desktop 再起動: 設定後完全に終了して再起動
  2. 接続確認: Claude Desktop で MCP サーバーが接続されたか確認
  3. テスト: 「猫の絵を描いて」とリクエストしてみる

📖 使用方法

画像生成

東京タワーの可愛いイラストを描いて

画像変換(ファイルパス)

/Users/username/image.jpg この画像に虹を追加して

画像変換(アップロード)

画像を Claude にアップロード後:

背景をレインボーブリッジの夜景にしてくれ

🔧 トラブルシューティング

サーバー接続失敗

  1. ログ確認: Claude Desktop のログフォルダで gemini-image-generator.log を確認
  2. パス確認: claude_desktop_config.json の Python パスが正確か確認
  3. 権限確認: 画像保存フォルダに書き込み権限があるか確認

API キーエラー

  1. キー有効性: Google AI Studio で API キーが有効化されているか確認
  2. 引用符確認: 設定ファイルで API キーが引用符で囲まれているか確認

手動テスト

cd ~/GeminiImageMCP source venv/bin/activate export GEMINI_API_KEY="実際のAPIキー" export OUTPUT_IMAGE_PATH="~/Pictures/ai_generated" python -m gemini_image_mcp.server

📊 提供ツール

1. generate_image_from_text

  • 機能: テキストプロンプトで新しい画像生成
  • 入力: 画像説明テキスト
  • 出力: 生成された画像(Claude チャット内表示 + ローカル保存)

2. transform_image_from_file

  • 機能: ファイルパスの画像をテキストプロンプトで変換
  • 入力: 画像ファイルパス、変換プロンプト
  • 出力: 変換された画像(Claude チャット内表示 + ローカル保存)

3. transform_image_from_encoded

  • 機能: Base64 エンコードされた画像をテキストプロンプトで変換
  • 入力: Base64 画像データ、変換プロンプト
  • 出力: 変換された画像(Claude チャット内表示 + ローカル保存)

📝 オリジナルからの相違点

この修正版は元のリポジトリの以下の問題を解決しました:

  • 元の問題: JSON シリアル化エラー (invalid utf-8 sequence)
  • 元の問題: MCP ツールがバイナリデータ返却により実行失敗
  • 修正事項: ファイルパス返却で安定的な動作
  • 修正事項: Claude Desktop で完璧に動作
  • 修正事項: 生成された画像を Claude チャット内で直接確認可能

🤝 貢献・お問い合わせ

📄 ライセンス

MIT License - 元のプロジェクトと同じ


ヒント: 初回設定時はステップごとに進め、問題が発生した場合はまずログファイルを確認してください! 🚀

Related MCP Servers

  • A
    security
    A
    license
    A
    quality
    A TypeScript server that integrates Google's Gemini Pro model with Claude Desktop through the Model Context Protocol, allowing Claude users to access Gemini's text generation capabilities.
    Last updated -
    38
    12
    MIT License
    • Apple
    • Linux
  • -
    security
    F
    license
    -
    quality
    A Model Context Protocol server that enables Claude Desktop to interact with Google's Gemini 2.5 Pro Experimental AI model, with features like Google Search integration and token usage reporting.
    Last updated -
    3
  • -
    security
    A
    license
    -
    quality
    Connects Claude Code with Google's Gemini AI, allowing users to ask Gemini questions, get code reviews, and brainstorm ideas directly within Claude Code.
    Last updated -
    222
    MIT License

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/sungmin-koo-ai/GeminiImageMCP'

If you have feedback or need assistance with the MCP directory API, please join our Discord server