значок кузнеца

Генератор изображений Gemini MCP-сервер

Name: Gemini Image Generator MCP Server
Author: qhdrl12

Создавайте высококачественные изображения из текстовых подсказок, используя модель Gemini от Google через протокол MCP.

Обзор

Этот сервер MCP позволяет любому помощнику ИИ генерировать изображения с помощью модели ИИ Gemini от Google. Сервер обрабатывает оперативную разработку, преобразование текста в изображение, генерацию имен файлов и локальное хранение изображений, что упрощает создание и управление изображениями, сгенерированными ИИ, через любой клиент MCP.

Related MCP server: Together AI Image Server

Функции

Генерация текста в изображение с помощью Gemini 2.0 Flash
Преобразование изображения в изображение на основе текстовых подсказок
Поддержка как файловых, так и закодированных в base64 изображений
Автоматическая интеллектуальная генерация имени файла на основе подсказок
Автоматический перевод неанглоязычных подсказок
Локальное хранилище изображений с настраиваемым путем вывода
Строгое исключение текста из сгенерированных изображений
Вывод изображения высокого разрешения
Прямой доступ к данным изображения и пути к файлу

Доступные инструменты MCP

Сервер предоставляет следующие инструменты MCP для помощников ИИ:

1. `generate_image_from_text`

Создает новое изображение из текстового описания.

generate_image_from_text(prompt: str) -> Tuple[bytes, str]

Параметры:

prompt : Текстовое описание изображения, которое вы хотите создать

Возврат:

Кортеж, содержащий:
- Необработанные данные изображения (байты)
- Путь к сохраненному файлу изображения (str)

Этот формат двойного возврата позволяет помощникам на базе искусственного интеллекта работать с данными изображения напрямую или ссылаться на сохраненный путь к файлу.

Примеры:

«Создайте изображение заката над горами»
«Создайте фотореалистичную летающую свинью в научно-фантастическом городе»

Пример вывода

Это изображение было создано с помощью подсказки:

"Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"

Летающая свинья над научно-фантастическим городом

3D-визуализация свиньи с крыльями и цилиндром, летящей над футуристическим научно-фантастическим городом, полным зелени.

Известные проблемы

При использовании этого сервера MCP с Claude Desktop Host:

Проблемы с производительностью : использование transform_image_from_encoded может занять значительно больше времени для обработки по сравнению с другими методами. Это связано с накладными расходами на передачу больших данных изображения в кодировке base64 через протокол MCP.
Проблемы с разрешением путей : могут возникнуть проблемы с правильным разрешением путей изображений при использовании Claude Desktop Host. Приложение-хост может неправильно интерпретировать возвращенные пути файлов, что затрудняет доступ к сгенерированным изображениям.

Для достижения наилучшего результата рассмотрите возможность использования альтернативных клиентов MCP или метода transform_image_from_file , когда это возможно.

2. `transform_image_from_encoded`

Преобразует существующее изображение на основе текстовой подсказки, используя данные изображения в кодировке base64.

transform_image_from_encoded(encoded_image: str, prompt: str) -> Tuple[bytes, str]

Параметры:

encoded_image : данные изображения, закодированные в Base64, с заголовком формата (должны быть в формате: "data:image/[format];base64,[data]")
prompt : Текстовое описание того, как вы хотите преобразовать изображение.

Возврат:

Кортеж, содержащий:
- Необработанные преобразованные данные изображения (байты)
- Путь к сохраненному преобразованному файлу изображения (str)

Пример:

«Добавьте снега к этому пейзажу»
«Изменить фон на пляж»

3. `transform_image_from_file`

Преобразует существующий файл изображения на основе текстовой подсказки.

transform_image_from_file(image_file_path: str, prompt: str) -> Tuple[bytes, str]

Параметры:

image_file_path : Путь к файлу изображения, который необходимо преобразовать.
prompt : Текстовое описание того, как вы хотите преобразовать изображение.

Возврат:

Кортеж, содержащий:
- Необработанные преобразованные данные изображения (байты)
- Путь к сохраненному преобразованному файлу изображения (str)

Примеры:

«Добавьте ламу рядом с человеком на этом изображении»
«Сделайте эту дневную сцену похожей на ночную»

Пример преобразования

Используя изображение летающей свиньи, созданное выше, мы применили преобразование с помощью следующего запроса:

"Add a cute baby whale flying alongside the pig"

До: Летающая свинья над научно-фантастическим городом

После: Летающая свинья с детенышем кита

Оригинальное изображение летающей свиньи с добавленным милым детенышем кита, летящим рядом с ней

Настраивать

Предпосылки

Питон 3.11+
Ключ API Google AI (Gemini)
Хост-приложение MCP (Claude Desktop App, Cursor или другие MCP-совместимые клиенты)

Получение API-ключа Gemini

Посетите страницу ключей API Google AI Studio
Войдите в систему, используя свой аккаунт Google.
Нажмите «Создать ключ API».
Скопируйте новый ключ API для использования в конфигурации.
Примечание: API-ключ предоставляет определенную квоту бесплатного использования в месяц. Вы можете проверить свое использование в Google AI Studio

Установка

Установка через Smithery

Чтобы автоматически установить Gemini Image Generator MCP для Claude Desktop через Smithery :

npx -y @smithery/cli install @qhdrl12/mcp-server-gemini-image-gen --client claude

Ручная установка

Клонируйте репозиторий:

git clone https://github.com/your-username/gemini-image-generator.git cd gemini-image-generator

Создайте виртуальную среду и установите зависимости:

# Using regular venv python -m venv .venv source .venv/bin/activate pip install -e . # Or using uv uv venv source .venv/bin/activate uv pip install -e .

Скопируйте пример файла среды и добавьте свой ключ API:

cp .env.example .env

Отредактируйте файл .env , включив в него ключ API Google Gemini и предпочитаемый выходной путь:

GEMINI_API_KEY="your-gemini-api-key-here" OUTPUT_IMAGE_PATH="/path/to/save/images"

Настроить рабочий стол Клода

Добавьте следующее в ваш claude_desktop_config.json :

macOS : ~/Library/Application Support/Claude/claude_desktop_config.json

{ "mcpServers": { "gemini-image-generator": { "command": "uv", "args": [ "--directory", "/absolute/path/to/gemini-image-generator", "run", "server.py" ], "env": { "GEMINI_API_KEY": "GEMINI_API_KEY", "OUTPUT_IMAGE_PATH": "OUTPUT_IMAGE_PATH" } } } }

Использование

После установки и настройки вы можете попросить Клода сгенерировать или преобразовать изображения, используя такие подсказки:

Создание новых изображений

«Создайте изображение заката над горами»
«Создайте иллюстрацию футуристического городского пейзажа»
«Нарисуй кошку в солнцезащитных очках»

Преобразование существующих изображений

«Преобразите это изображение, добавив в него снег»
«Отредактируйте это фото так, чтобы оно выглядело так, будто оно было сделано ночью»
«Добавьте летящего дракона на задний план этой картинки»

Сгенерированные/преобразованные изображения будут сохранены в настроенном вами выходном пути и отображены в Claude. Благодаря обновленным типам возврата помощники ИИ также могут работать напрямую с данными изображений без необходимости доступа к сохраненным файлам.

Тестирование

Вы можете протестировать приложение, запустив сервер разработки FastMCP:

fastmcp dev server.py

Эта команда запускает локальный сервер разработки и делает MCP Inspector доступным по адресу http://localhost:5173/ . MCP Inspector предоставляет удобный веб-интерфейс, где вы можете напрямую протестировать инструмент генерации изображений без необходимости использования Claude или другого клиента MCP. Вы можете вводить текстовые подсказки, запускать инструмент и немедленно видеть результаты, что полезно для разработки и отладки.

Лицензия

Лицензия Массачусетского технологического института

Gemini Image Generator MCP Server

Генератор изображений Gemini MCP-сервер

Обзор

Функции

Доступные инструменты MCP

1. `generate_image_from_text`

Пример вывода

Известные проблемы

2. `transform_image_from_encoded`

3. `transform_image_from_file`

Пример преобразования

Настраивать

Предпосылки

Получение API-ключа Gemini

Установка

Установка через Smithery

Ручная установка

Настроить рабочий стол Клода

Использование

Создание новых изображений

Преобразование существующих изображений

Тестирование

Лицензия

Resources

Tools

Appeared in Searches

New MCP Servers

Latest Blog Posts

MCP directory API

Генератор изображений Gemini MCP-сервер

Обзор

Функции

Доступные инструменты MCP

1. generate_image_from_text

Пример вывода

Известные проблемы

2. transform_image_from_encoded

3. transform_image_from_file

Пример преобразования

Настраивать

Предпосылки

Получение API-ключа Gemini

Установка

Установка через Smithery

Ручная установка

Настроить рабочий стол Клода

Использование

Создание новых изображений

Преобразование существующих изображений

Тестирование

Лицензия

Resources

Tools

Appeared in Searches

New MCP Servers

Latest Blog Posts

MCP directory API

1. `generate_image_from_text`

2. `transform_image_from_encoded`

3. `transform_image_from_file`