Skip to main content
Glama

Gemini Image Generator MCP Server

Значок MseeP значок кузнеца

Генератор изображений Gemini MCP-сервер

Создавайте высококачественные изображения из текстовых подсказок, используя модель Gemini от Google через протокол MCP.

Обзор

Этот сервер MCP позволяет любому помощнику ИИ генерировать изображения с помощью модели ИИ Gemini от Google. Сервер обрабатывает оперативную разработку, преобразование текста в изображение, генерацию имен файлов и локальное хранение изображений, что упрощает создание и управление изображениями, сгенерированными ИИ, через любой клиент MCP.

Функции

  • Генерация текста в изображение с помощью Gemini 2.0 Flash

  • Преобразование изображения в изображение на основе текстовых подсказок

  • Поддержка как файловых, так и закодированных в base64 изображений

  • Автоматическая интеллектуальная генерация имени файла на основе подсказок

  • Автоматический перевод неанглоязычных подсказок

  • Локальное хранилище изображений с настраиваемым путем вывода

  • Строгое исключение текста из сгенерированных изображений

  • Вывод изображения высокого разрешения

  • Прямой доступ к данным изображения и пути к файлу

Доступные инструменты MCP

Сервер предоставляет следующие инструменты MCP для помощников ИИ:

1. generate_image_from_text

Создает новое изображение из текстового описания.

generate_image_from_text(prompt: str) -> Tuple[bytes, str]

Параметры:

  • prompt : Текстовое описание изображения, которое вы хотите создать

Возврат:

  • Кортеж, содержащий:

    • Необработанные данные изображения (байты)

    • Путь к сохраненному файлу изображения (str)

Этот формат двойного возврата позволяет помощникам на базе искусственного интеллекта работать с данными изображения напрямую или ссылаться на сохраненный путь к файлу.

Примеры:

  • «Создайте изображение заката над горами»

  • «Создайте фотореалистичную летающую свинью в научно-фантастическом городе»

Пример вывода

Это изображение было создано с помощью подсказки:

"Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"

Летающая свинья над научно-фантастическим городом

3D-визуализация свиньи с крыльями и цилиндром, летящей над футуристическим научно-фантастическим городом, полным зелени.

Известные проблемы

При использовании этого сервера MCP с Claude Desktop Host:

  1. Проблемы с производительностью : использование transform_image_from_encoded может занять значительно больше времени для обработки по сравнению с другими методами. Это связано с накладными расходами на передачу больших данных изображения в кодировке base64 через протокол MCP.

  2. Проблемы с разрешением путей : могут возникнуть проблемы с правильным разрешением путей изображений при использовании Claude Desktop Host. Приложение-хост может неправильно интерпретировать возвращенные пути файлов, что затрудняет доступ к сгенерированным изображениям.

Для достижения наилучшего результата рассмотрите возможность использования альтернативных клиентов MCP или метода transform_image_from_file , когда это возможно.

2. transform_image_from_encoded

Преобразует существующее изображение на основе текстовой подсказки, используя данные изображения в кодировке base64.

transform_image_from_encoded(encoded_image: str, prompt: str) -> Tuple[bytes, str]

Параметры:

  • encoded_image : данные изображения, закодированные в Base64, с заголовком формата (должны быть в формате: "data:image/[format];base64,[data]")

  • prompt : Текстовое описание того, как вы хотите преобразовать изображение.

Возврат:

  • Кортеж, содержащий:

    • Необработанные преобразованные данные изображения (байты)

    • Путь к сохраненному преобразованному файлу изображения (str)

Пример:

  • «Добавьте снега к этому пейзажу»

  • «Изменить фон на пляж»

3. transform_image_from_file

Преобразует существующий файл изображения на основе текстовой подсказки.

transform_image_from_file(image_file_path: str, prompt: str) -> Tuple[bytes, str]

Параметры:

  • image_file_path : Путь к файлу изображения, который необходимо преобразовать.

  • prompt : Текстовое описание того, как вы хотите преобразовать изображение.

Возврат:

  • Кортеж, содержащий:

    • Необработанные преобразованные данные изображения (байты)

    • Путь к сохраненному преобразованному файлу изображения (str)

Примеры:

  • «Добавьте ламу рядом с человеком на этом изображении»

  • «Сделайте эту дневную сцену похожей на ночную»

Пример преобразования

Используя изображение летающей свиньи, созданное выше, мы применили преобразование с помощью следующего запроса:

"Add a cute baby whale flying alongside the pig"

До: Летающая свинья над научно-фантастическим городом

После: Летающая свинья с детенышем кита

Оригинальное изображение летающей свиньи с добавленным милым детенышем кита, летящим рядом с ней

Настраивать

Предпосылки

  • Питон 3.11+

  • Ключ API Google AI (Gemini)

  • Хост-приложение MCP (Claude Desktop App, Cursor или другие MCP-совместимые клиенты)

Получение API-ключа Gemini

  1. Посетите страницу ключей API Google AI Studio

  2. Войдите в систему, используя свой аккаунт Google.

  3. Нажмите «Создать ключ API».

  4. Скопируйте новый ключ API для использования в конфигурации.

  5. Примечание: API-ключ предоставляет определенную квоту бесплатного использования в месяц. Вы можете проверить свое использование в Google AI Studio

Установка

Установка через Smithery

Чтобы автоматически установить Gemini Image Generator MCP для Claude Desktop через Smithery :

npx -y @smithery/cli install @qhdrl12/mcp-server-gemini-image-gen --client claude

Ручная установка

  1. Клонируйте репозиторий:

git clone https://github.com/your-username/gemini-image-generator.git cd gemini-image-generator
  1. Создайте виртуальную среду и установите зависимости:

# Using regular venv python -m venv .venv source .venv/bin/activate pip install -e . # Or using uv uv venv source .venv/bin/activate uv pip install -e .
  1. Скопируйте пример файла среды и добавьте свой ключ API:

cp .env.example .env
  1. Отредактируйте файл .env , включив в него ключ API Google Gemini и предпочитаемый выходной путь:

GEMINI_API_KEY="your-gemini-api-key-here" OUTPUT_IMAGE_PATH="/path/to/save/images"

Настроить рабочий стол Клода

Добавьте следующее в ваш claude_desktop_config.json :

  • macOS : ~/Library/Application Support/Claude/claude_desktop_config.json

{ "mcpServers": { "gemini-image-generator": { "command": "uv", "args": [ "--directory", "/absolute/path/to/gemini-image-generator", "run", "server.py" ], "env": { "GEMINI_API_KEY": "GEMINI_API_KEY", "OUTPUT_IMAGE_PATH": "OUTPUT_IMAGE_PATH" } } } }

Использование

После установки и настройки вы можете попросить Клода сгенерировать или преобразовать изображения, используя такие подсказки:

Создание новых изображений

  • «Создайте изображение заката над горами»

  • «Создайте иллюстрацию футуристического городского пейзажа»

  • «Нарисуй кошку в солнцезащитных очках»

Преобразование существующих изображений

  • «Преобразите это изображение, добавив в него снег»

  • «Отредактируйте это фото так, чтобы оно выглядело так, будто оно было сделано ночью»

  • «Добавьте летящего дракона на задний план этой картинки»

Сгенерированные/преобразованные изображения будут сохранены в настроенном вами выходном пути и отображены в Claude. Благодаря обновленным типам возврата помощники ИИ также могут работать напрямую с данными изображений без необходимости доступа к сохраненным файлам.

Тестирование

Вы можете протестировать приложение, запустив сервер разработки FastMCP:

fastmcp dev server.py

Эта команда запускает локальный сервер разработки и делает MCP Inspector доступным по адресу http://localhost:5173/ . MCP Inspector предоставляет удобный веб-интерфейс, где вы можете напрямую протестировать инструмент генерации изображений без необходимости использования Claude или другого клиента MCP. Вы можете вводить текстовые подсказки, запускать инструмент и немедленно видеть результаты, что полезно для разработки и отладки.

Лицензия

Лицензия Массачусетского технологического института

Deploy Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Related MCP Servers

  • A
    security
    F
    license
    A
    quality
    Enables users to generate images from text prompts using Replicate's model, with configurable parameters and full MCP protocol compliance.
    Last updated -
    1
    129
  • A
    security
    A
    license
    A
    quality
    A MCP server that enables Claude and other MCP-compatible assistants to generate images from text prompts using Together AI's image generation models.
    Last updated -
    4
    MIT License
    • Apple
    • Linux
  • A
    security
    A
    license
    A
    quality
    A Model Context Protocol server that provides image generation capabilities using Google's Gemini 2 API, allowing users to generate multiple images with customizable parameters like prompts, aspect ratios, and person generation settings.
    Last updated -
    1
    26
    4
    MIT License
    • Apple
    • Linux
  • -
    security
    A
    license
    -
    quality
    Provides tools for generating and editing images using OpenAI's gpt-image-1 model via an MCP interface, enabling AI assistants to create and modify images based on text prompts.
    Last updated -
    16
    Apache 2.0
    • Linux
    • Apple

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/qhdrl12/mcp-server-gemini-image-generator'

If you have feedback or need assistance with the MCP directory API, please join our Discord server