Integrations
Supports environment variable configuration through .env files for storing API keys and output path settings.
Enables text-to-image generation and image transformation using Google's Gemini AI model, supporting high-resolution image creation from text prompts and modification of existing images based on textual descriptions.
Includes specific configuration paths for macOS users to set up the MCP server with Claude Desktop.
Генератор изображений Gemini MCP-сервер
Создавайте высококачественные изображения из текстовых подсказок, используя модель Gemini от Google через протокол MCP.
Обзор
Этот сервер MCP позволяет любому помощнику ИИ генерировать изображения с помощью модели ИИ Gemini от Google. Сервер обрабатывает оперативную разработку, преобразование текста в изображение, генерацию имен файлов и локальное хранение изображений, что упрощает создание и управление изображениями, сгенерированными ИИ, через любой клиент MCP.
Функции
- Генерация текста в изображение с помощью Gemini 2.0 Flash
- Преобразование изображения в изображение на основе текстовых подсказок
- Поддержка как файловых, так и закодированных в base64 изображений
- Автоматическая интеллектуальная генерация имени файла на основе подсказок
- Автоматический перевод неанглоязычных подсказок
- Локальное хранилище изображений с настраиваемым путем вывода
- Строгое исключение текста из сгенерированных изображений
- Вывод изображения высокого разрешения
- Прямой доступ к данным изображения и пути к файлу
Доступные инструменты MCP
Сервер предоставляет следующие инструменты MCP для помощников ИИ:
1. generate_image_from_text
Создает новое изображение из текстового описания.
Параметры:
prompt
: Текстовое описание изображения, которое вы хотите создать
Возврат:
- Кортеж, содержащий:
- Необработанные данные изображения (байты)
- Путь к сохраненному файлу изображения (str)
Этот формат двойного возврата позволяет помощникам на базе искусственного интеллекта работать с данными изображения напрямую или ссылаться на сохраненный путь к файлу.
Примеры:
- «Создайте изображение заката над горами»
- «Создайте фотореалистичную летающую свинью в научно-фантастическом городе»
Пример вывода
Это изображение было создано с помощью подсказки:
3D-визуализация свиньи с крыльями и цилиндром, летящей над футуристическим научно-фантастическим городом, полным зелени.
Известные проблемы
При использовании этого сервера MCP с Claude Desktop Host:
- Проблемы с производительностью : использование
transform_image_from_encoded
может занять значительно больше времени для обработки по сравнению с другими методами. Это связано с накладными расходами на передачу больших данных изображения в кодировке base64 через протокол MCP. - Проблемы с разрешением путей : могут возникнуть проблемы с правильным разрешением путей изображений при использовании Claude Desktop Host. Приложение-хост может неправильно интерпретировать возвращенные пути файлов, что затрудняет доступ к сгенерированным изображениям.
Для достижения наилучшего результата рассмотрите возможность использования альтернативных клиентов MCP или метода transform_image_from_file
, когда это возможно.
2. transform_image_from_encoded
Преобразует существующее изображение на основе текстовой подсказки, используя данные изображения в кодировке base64.
Параметры:
encoded_image
: данные изображения, закодированные в Base64, с заголовком формата (должны быть в формате: "data:image/[format];base64,[data]")prompt
: Текстовое описание того, как вы хотите преобразовать изображение.
Возврат:
- Кортеж, содержащий:
- Необработанные преобразованные данные изображения (байты)
- Путь к сохраненному преобразованному файлу изображения (str)
Пример:
- «Добавьте снега к этому пейзажу»
- «Изменить фон на пляж»
3. transform_image_from_file
Преобразует существующий файл изображения на основе текстовой подсказки.
Параметры:
image_file_path
: Путь к файлу изображения, который необходимо преобразовать.prompt
: Текстовое описание того, как вы хотите преобразовать изображение.
Возврат:
- Кортеж, содержащий:
- Необработанные преобразованные данные изображения (байты)
- Путь к сохраненному преобразованному файлу изображения (str)
Примеры:
- «Добавьте ламу рядом с человеком на этом изображении»
- «Сделайте эту дневную сцену похожей на ночную»
Пример преобразования
Используя изображение летающей свиньи, созданное выше, мы применили преобразование с помощью следующего запроса:
До:
После:
Оригинальное изображение летающей свиньи с добавленным милым детенышем кита, летящим рядом с ней
Настраивать
Предпосылки
- Питон 3.11+
- Ключ API Google AI (Gemini)
- Хост-приложение MCP (Claude Desktop App, Cursor или другие MCP-совместимые клиенты)
Получение API-ключа Gemini
- Посетите страницу ключей API Google AI Studio
- Войдите в систему, используя свой аккаунт Google.
- Нажмите «Создать ключ API».
- Скопируйте новый ключ API для использования в конфигурации.
- Примечание: API-ключ предоставляет определенную квоту бесплатного использования в месяц. Вы можете проверить свое использование в Google AI Studio
Установка
Установка через Smithery
Чтобы автоматически установить Gemini Image Generator MCP для Claude Desktop через Smithery :
Ручная установка
- Клонируйте репозиторий:
- Создайте виртуальную среду и установите зависимости:
- Скопируйте пример файла среды и добавьте свой ключ API:
- Отредактируйте файл
.env
, включив в него ключ API Google Gemini и предпочитаемый выходной путь:
Настроить рабочий стол Клода
Добавьте следующее в ваш claude_desktop_config.json
:
- macOS :
~/Library/Application Support/Claude/claude_desktop_config.json
Использование
После установки и настройки вы можете попросить Клода сгенерировать или преобразовать изображения, используя такие подсказки:
Создание новых изображений
- «Создайте изображение заката над горами»
- «Создайте иллюстрацию футуристического городского пейзажа»
- «Нарисуй кошку в солнцезащитных очках»
Преобразование существующих изображений
- «Преобразите это изображение, добавив в него снег»
- «Отредактируйте это фото так, чтобы оно выглядело так, будто оно было сделано ночью»
- «Добавьте летящего дракона на задний план этой картинки»
Сгенерированные/преобразованные изображения будут сохранены в настроенном вами выходном пути и отображены в Claude. Благодаря обновленным типам возврата помощники ИИ также могут работать напрямую с данными изображений без необходимости доступа к сохраненным файлам.
Тестирование
Вы можете протестировать приложение, запустив сервер разработки FastMCP:
Эта команда запускает локальный сервер разработки и делает MCP Inspector доступным по адресу http://localhost:5173/ . MCP Inspector предоставляет удобный веб-интерфейс, где вы можете напрямую протестировать инструмент генерации изображений без необходимости использования Claude или другого клиента MCP. Вы можете вводить текстовые подсказки, запускать инструмент и немедленно видеть результаты, что полезно для разработки и отладки.
Лицензия
Лицензия Массачусетского технологического института
You must be authenticated.
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Позволяет помощникам на основе искусственного интеллекта генерировать и преобразовывать высококачественные изображения из текстовых подсказок с использованием модели Gemini от Google через протокол MCP.
Related MCP Servers
- AsecurityFlicenseAqualityEnables users to generate images from text prompts using Replicate's model, with configurable parameters and full MCP protocol compliance.Last updated -163TypeScript
- AsecurityAlicenseAqualityA MCP server that enables Claude and other MCP-compatible assistants to generate images from text prompts using Together AI's image generation models.Last updated -12TypeScriptMIT License
- -securityAlicense-qualityA server that enables Claude Desktop to generate images using Google's Gemini AI models through the Model Context Protocol (MCP).Last updated -1JavaScriptMIT License
- -securityFlicense-qualityA server that provides access to Google Gemini AI capabilities including text generation, image analysis, YouTube video analysis, and web search functionality through the MCP protocol.Last updated -2TypeScript