Генератор изображений Gemini MCP-сервер
Создавайте высококачественные изображения из текстовых подсказок, используя модель Gemini от Google через протокол MCP.
Обзор
Этот сервер MCP позволяет любому помощнику ИИ генерировать изображения с помощью модели ИИ Gemini от Google. Сервер обрабатывает оперативную разработку, преобразование текста в изображение, генерацию имен файлов и локальное хранение изображений, что упрощает создание и управление изображениями, сгенерированными ИИ, через любой клиент MCP.
Related MCP server: Together AI Image Server
Функции
Генерация текста в изображение с помощью Gemini 2.0 Flash
Преобразование изображения в изображение на основе текстовых подсказок
Поддержка как файловых, так и закодированных в base64 изображений
Автоматическая интеллектуальная генерация имени файла на основе подсказок
Автоматический перевод неанглоязычных подсказок
Локальное хранилище изображений с настраиваемым путем вывода
Строгое исключение текста из сгенерированных изображений
Вывод изображения высокого разрешения
Прямой доступ к данным изображения и пути к файлу
Доступные инструменты MCP
Сервер предоставляет следующие инструменты MCP для помощников ИИ:
1. generate_image_from_text
Создает новое изображение из текстового описания.
generate_image_from_text(prompt: str) -> Tuple[bytes, str]Параметры:
prompt: Текстовое описание изображения, которое вы хотите создать
Возврат:
Кортеж, содержащий:
Необработанные данные изображения (байты)
Путь к сохраненному файлу изображения (str)
Этот формат двойного возврата позволяет помощникам на базе искусственного интеллекта работать с данными изображения напрямую или ссылаться на сохраненный путь к файлу.
Примеры:
«Создайте изображение заката над горами»
«Создайте фотореалистичную летающую свинью в научно-фантастическом городе»
Пример вывода
Это изображение было создано с помощью подсказки:
"Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"
3D-визуализация свиньи с крыльями и цилиндром, летящей над футуристическим научно-фантастическим городом, полным зелени.
Известные проблемы
При использовании этого сервера MCP с Claude Desktop Host:
Проблемы с производительностью : использование
transform_image_from_encodedможет занять значительно больше времени для обработки по сравнению с другими методами. Это связано с накладными расходами на передачу больших данных изображения в кодировке base64 через протокол MCP.Проблемы с разрешением путей : могут возникнуть проблемы с правильным разрешением путей изображений при использовании Claude Desktop Host. Приложение-хост может неправильно интерпретировать возвращенные пути файлов, что затрудняет доступ к сгенерированным изображениям.
Для достижения наилучшего результата рассмотрите возможность использования альтернативных клиентов MCP или метода transform_image_from_file , когда это возможно.
2. transform_image_from_encoded
Преобразует существующее изображение на основе текстовой подсказки, используя данные изображения в кодировке base64.
transform_image_from_encoded(encoded_image: str, prompt: str) -> Tuple[bytes, str]Параметры:
encoded_image: данные изображения, закодированные в Base64, с заголовком формата (должны быть в формате: "data:image/[format];base64,[data]")prompt: Текстовое описание того, как вы хотите преобразовать изображение.
Возврат:
Кортеж, содержащий:
Необработанные преобразованные данные изображения (байты)
Путь к сохраненному преобразованному файлу изображения (str)
Пример:
«Добавьте снега к этому пейзажу»
«Изменить фон на пляж»
3. transform_image_from_file
Преобразует существующий файл изображения на основе текстовой подсказки.
transform_image_from_file(image_file_path: str, prompt: str) -> Tuple[bytes, str]Параметры:
image_file_path: Путь к файлу изображения, который необходимо преобразовать.prompt: Текстовое описание того, как вы хотите преобразовать изображение.
Возврат:
Кортеж, содержащий:
Необработанные преобразованные данные изображения (байты)
Путь к сохраненному преобразованному файлу изображения (str)
Примеры:
«Добавьте ламу рядом с человеком на этом изображении»
«Сделайте эту дневную сцену похожей на ночную»
Пример преобразования
Используя изображение летающей свиньи, созданное выше, мы применили преобразование с помощью следующего запроса:
"Add a cute baby whale flying alongside the pig"До: 
После: 
Оригинальное изображение летающей свиньи с добавленным милым детенышем кита, летящим рядом с ней
Настраивать
Предпосылки
Питон 3.11+
Ключ API Google AI (Gemini)
Хост-приложение MCP (Claude Desktop App, Cursor или другие MCP-совместимые клиенты)
Получение API-ключа Gemini
Посетите страницу ключей API Google AI Studio
Войдите в систему, используя свой аккаунт Google.
Нажмите «Создать ключ API».
Скопируйте новый ключ API для использования в конфигурации.
Примечание: API-ключ предоставляет определенную квоту бесплатного использования в месяц. Вы можете проверить свое использование в Google AI Studio
Установка
Установка через Smithery
Чтобы автоматически установить Gemini Image Generator MCP для Claude Desktop через Smithery :
npx -y @smithery/cli install @qhdrl12/mcp-server-gemini-image-gen --client claudeРучная установка
Клонируйте репозиторий:
git clone https://github.com/your-username/gemini-image-generator.git
cd gemini-image-generatorСоздайте виртуальную среду и установите зависимости:
# Using regular venv
python -m venv .venv
source .venv/bin/activate
pip install -e .
# Or using uv
uv venv
source .venv/bin/activate
uv pip install -e .Скопируйте пример файла среды и добавьте свой ключ API:
cp .env.example .envОтредактируйте файл
.env, включив в него ключ API Google Gemini и предпочитаемый выходной путь:
GEMINI_API_KEY="your-gemini-api-key-here"
OUTPUT_IMAGE_PATH="/path/to/save/images"Настроить рабочий стол Клода
Добавьте следующее в ваш claude_desktop_config.json :
macOS :
~/Library/Application Support/Claude/claude_desktop_config.json
{
"mcpServers": {
"gemini-image-generator": {
"command": "uv",
"args": [
"--directory",
"/absolute/path/to/gemini-image-generator",
"run",
"server.py"
],
"env": {
"GEMINI_API_KEY": "GEMINI_API_KEY",
"OUTPUT_IMAGE_PATH": "OUTPUT_IMAGE_PATH"
}
}
}
}Использование
После установки и настройки вы можете попросить Клода сгенерировать или преобразовать изображения, используя такие подсказки:
Создание новых изображений
«Создайте изображение заката над горами»
«Создайте иллюстрацию футуристического городского пейзажа»
«Нарисуй кошку в солнцезащитных очках»
Преобразование существующих изображений
«Преобразите это изображение, добавив в него снег»
«Отредактируйте это фото так, чтобы оно выглядело так, будто оно было сделано ночью»
«Добавьте летящего дракона на задний план этой картинки»
Сгенерированные/преобразованные изображения будут сохранены в настроенном вами выходном пути и отображены в Claude. Благодаря обновленным типам возврата помощники ИИ также могут работать напрямую с данными изображений без необходимости доступа к сохраненным файлам.
Тестирование
Вы можете протестировать приложение, запустив сервер разработки FastMCP:
fastmcp dev server.pyЭта команда запускает локальный сервер разработки и делает MCP Inspector доступным по адресу http://localhost:5173/ . MCP Inspector предоставляет удобный веб-интерфейс, где вы можете напрямую протестировать инструмент генерации изображений без необходимости использования Claude или другого клиента MCP. Вы можете вводить текстовые подсказки, запускать инструмент и немедленно видеть результаты, что полезно для разработки и отладки.
Лицензия
Лицензия Массачусетского технологического института