Генератор изображений Gemini MCP-сервер
Создавайте высококачественные изображения из текстовых подсказок, используя модель Gemini от Google через протокол MCP.
Обзор
Этот сервер MCP позволяет любому помощнику ИИ генерировать изображения с помощью модели ИИ Gemini от Google. Сервер обрабатывает оперативную разработку, преобразование текста в изображение, генерацию имен файлов и локальное хранение изображений, что упрощает создание и управление изображениями, сгенерированными ИИ, через любой клиент MCP.
Функции
Генерация текста в изображение с помощью Gemini 2.0 Flash
Преобразование изображения в изображение на основе текстовых подсказок
Поддержка как файловых, так и закодированных в base64 изображений
Автоматическая интеллектуальная генерация имени файла на основе подсказок
Автоматический перевод неанглоязычных подсказок
Локальное хранилище изображений с настраиваемым путем вывода
Строгое исключение текста из сгенерированных изображений
Вывод изображения высокого разрешения
Прямой доступ к данным изображения и пути к файлу
Доступные инструменты MCP
Сервер предоставляет следующие инструменты MCP для помощников ИИ:
1. generate_image_from_text
Создает новое изображение из текстового описания.
Параметры:
prompt: Текстовое описание изображения, которое вы хотите создать
Возврат:
Кортеж, содержащий:
Необработанные данные изображения (байты)
Путь к сохраненному файлу изображения (str)
Этот формат двойного возврата позволяет помощникам на базе искусственного интеллекта работать с данными изображения напрямую или ссылаться на сохраненный путь к файлу.
Примеры:
«Создайте изображение заката над горами»
«Создайте фотореалистичную летающую свинью в научно-фантастическом городе»
Пример вывода
Это изображение было создано с помощью подсказки:

3D-визуализация свиньи с крыльями и цилиндром, летящей над футуристическим научно-фантастическим городом, полным зелени.
Известные проблемы
При использовании этого сервера MCP с Claude Desktop Host:
Проблемы с производительностью : использование
transform_image_from_encodedможет занять значительно больше времени для обработки по сравнению с другими методами. Это связано с накладными расходами на передачу больших данных изображения в кодировке base64 через протокол MCP.Проблемы с разрешением путей : могут возникнуть проблемы с правильным разрешением путей изображений при использовании Claude Desktop Host. Приложение-хост может неправильно интерпретировать возвращенные пути файлов, что затрудняет доступ к сгенерированным изображениям.
Для достижения наилучшего результата рассмотрите возможность использования альтернативных клиентов MCP или метода transform_image_from_file , когда это возможно.
2. transform_image_from_encoded
Преобразует существующее изображение на основе текстовой подсказки, используя данные изображения в кодировке base64.
Параметры:
encoded_image: данные изображения, закодированные в Base64, с заголовком формата (должны быть в формате: "data:image/[format];base64,[data]")prompt: Текстовое описание того, как вы хотите преобразовать изображение.
Возврат:
Кортеж, содержащий:
Необработанные преобразованные данные изображения (байты)
Путь к сохраненному преобразованному файлу изображения (str)
Пример:
«Добавьте снега к этому пейзажу»
«Изменить фон на пляж»
3. transform_image_from_file
Преобразует существующий файл изображения на основе текстовой подсказки.
Параметры:
image_file_path: Путь к файлу изображения, который необходимо преобразовать.prompt: Текстовое описание того, как вы хотите преобразовать изображение.
Возврат:
Кортеж, содержащий:
Необработанные преобразованные данные изображения (байты)
Путь к сохраненному преобразованному файлу изображения (str)
Примеры:
«Добавьте ламу рядом с человеком на этом изображении»
«Сделайте эту дневную сцену похожей на ночную»
Пример преобразования
Используя изображение летающей свиньи, созданное выше, мы применили преобразование с помощью следующего запроса:
До: 
После: 
Оригинальное изображение летающей свиньи с добавленным милым детенышем кита, летящим рядом с ней
Настраивать
Предпосылки
Питон 3.11+
Ключ API Google AI (Gemini)
Хост-приложение MCP (Claude Desktop App, Cursor или другие MCP-совместимые клиенты)
Получение API-ключа Gemini
Посетите страницу ключей API Google AI Studio
Войдите в систему, используя свой аккаунт Google.
Нажмите «Создать ключ API».
Скопируйте новый ключ API для использования в конфигурации.
Примечание: API-ключ предоставляет определенную квоту бесплатного использования в месяц. Вы можете проверить свое использование в Google AI Studio
Установка
Установка через Smithery
Чтобы автоматически установить Gemini Image Generator MCP для Claude Desktop через Smithery :
Ручная установка
Клонируйте репозиторий:
Создайте виртуальную среду и установите зависимости:
Скопируйте пример файла среды и добавьте свой ключ API:
Отредактируйте файл
.env, включив в него ключ API Google Gemini и предпочитаемый выходной путь:
Настроить рабочий стол Клода
Добавьте следующее в ваш claude_desktop_config.json :
macOS :
~/Library/Application Support/Claude/claude_desktop_config.json
Использование
После установки и настройки вы можете попросить Клода сгенерировать или преобразовать изображения, используя такие подсказки:
Создание новых изображений
«Создайте изображение заката над горами»
«Создайте иллюстрацию футуристического городского пейзажа»
«Нарисуй кошку в солнцезащитных очках»
Преобразование существующих изображений
«Преобразите это изображение, добавив в него снег»
«Отредактируйте это фото так, чтобы оно выглядело так, будто оно было сделано ночью»
«Добавьте летящего дракона на задний план этой картинки»
Сгенерированные/преобразованные изображения будут сохранены в настроенном вами выходном пути и отображены в Claude. Благодаря обновленным типам возврата помощники ИИ также могут работать напрямую с данными изображений без необходимости доступа к сохраненным файлам.
Тестирование
Вы можете протестировать приложение, запустив сервер разработки FastMCP:
Эта команда запускает локальный сервер разработки и делает MCP Inspector доступным по адресу http://localhost:5173/ . MCP Inspector предоставляет удобный веб-интерфейс, где вы можете напрямую протестировать инструмент генерации изображений без необходимости использования Claude или другого клиента MCP. Вы можете вводить текстовые подсказки, запускать инструмент и немедленно видеть результаты, что полезно для разработки и отладки.
Лицензия
Лицензия Массачусетского технологического института
Related MCP Servers
- AsecurityFlicenseAqualityEnables users to generate images from text prompts using Replicate's model, with configurable parameters and full MCP protocol compliance.Last updated -1129
- AsecurityAlicenseAqualityA MCP server that enables Claude and other MCP-compatible assistants to generate images from text prompts using Together AI's image generation models.Last updated -4MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that provides image generation capabilities using Google's Gemini 2 API, allowing users to generate multiple images with customizable parameters like prompts, aspect ratios, and person generation settings.Last updated -1264MIT License
- -securityAlicense-qualityProvides tools for generating and editing images using OpenAI's gpt-image-1 model via an MCP interface, enabling AI assistants to create and modify images based on text prompts.Last updated -16Apache 2.0