Provides tools for generating and editing images using OpenAI's GPT-4o/gpt-image-1 APIs, supporting text-to-image generation, image editing operations (inpainting, outpainting, compositing), and advanced prompt control.
openai-gpt-image-mcp
Сервер инструментов Model Context Protocol (MCP) для API-интерфейсов OpenAI для генерации и редактирования изображений GPT-4o/gpt-image-1.
- Создавайте изображения из текстовых подсказок, используя новейшие модели OpenAI.
- Редактируйте изображения (закрашивание, перекрашивание, композиция) с расширенными функциями оперативного управления.
- Поддерживает : Claude Desktop, Cursor, VSCode, Windsurf и любой MCP-совместимый клиент.
✨ Особенности
- create-image : создание изображений по запросу с расширенными параметрами (размер, качество, фон и т. д.).
- edit-image : редактирование или расширение изображений с использованием подсказки и дополнительной маски, поддерживающей как пути к файлам, так и ввод base64.
- Вывод файла : сохранение созданных изображений непосредственно на диск или получение в формате base64.
🚀 Установка
🔑 Конфигурация
Добавьте в конфигурацию Claude Desktop или VSCode (включая Cursor/Windsurf):
⚡ Продвинутый
- Для
create-image
установитеn
, чтобы сгенерировать до 10 изображений одновременно. - Для
edit-image
укажите изображение маски (путь к файлу или base64) для управления тем, где применяются изменения. - Все варианты смотрите
src/index.ts
.
🧑💻 Разработка
- Исходный код TypeScript:
src/index.ts
- Сборка:
yarn build
- Запустить:
node dist/index.js
📝 Лицензия
Массачусетский технологический институт
🩺 Устранение неполадок
- Убедитесь, что ваш
OPENAI_API_KEY
действителен и имеет доступ к API изображений. - У вас должна быть проверенная организация OpenAI . После проверки может потребоваться 15–20 минут для активации доступа к API изображения.
- Пути к файлам должны быть абсолютными.
- Unix/macOS/Linux : Начинается с
/
(например,/path/to/image.png
) - Windows : буква диска, за которой следует
:
(например,C:/path/to/image.png
илиC:\path\to\image.png
)
- Unix/macOS/Linux : Начинается с
- Для вывода файла убедитесь, что каталог доступен для записи.
- Если вы видите ошибки, связанные с типами файлов, проверьте расширения и форматы файлов изображений.
⚠️ Ограничения и обработка больших файлов
- Ограничение полезной нагрузки в 1 МБ: клиенты MCP (включая Claude Desktop) имеют жесткое ограничение в 1 МБ для ответов инструмента. Большие изображения (особенно с высоким разрешением или множественные изображения) могут легко превысить этот лимит, если будут возвращены в виде base64.
- Автоматическое переключение на вывод файла: если общий размер изображения превышает 1 МБ, инструмент автоматически сохранит изображения на диск и вернет путь(и) к файлу вместо base64. Это обеспечивает совместимость и предотвращает ошибки, такие как
result exceeds maximum length of 1048576
. - Расположение файла по умолчанию: если не указать путь
file_output
, изображения будут сохранены в/tmp
(или в каталоге, заданном переменной средыMCP_HF_WORK_DIR
) с уникальным именем файла. - Переменная среды:
MCP_HF_WORK_DIR
: Установите это, чтобы контролировать, где сохраняются большие изображения и выходные файлы. Пример:export MCP_HF_WORK_DIR=/your/desired/dir
- Рекомендация: для больших или производственных изображений всегда используйте вывод в виде файла и убедитесь, что ваш клиент настроен на обработку путей к файлам.
📚 Ссылки
🙏 Кредиты
- Создано с помощью @modelcontextprotocol/sdk
- Использует OpenAI Node.js SDK
- Создано SureScale.ai
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Сервер инструментов MCP, позволяющий генерировать и редактировать изображения с помощью моделей изображений OpenAI, поддерживающий генерацию текста в изображение и расширенное редактирование изображений (закрашивание, закрашивание) на различных клиентах, совместимых с MCP.
Related MCP Servers
- AsecurityAlicenseAqualityAn MCP Server that integrates with Stability AI's API to provide high-quality image generation, editing, and manipulation capabilities including background removal, outpainting, search-and-replace, and upscaling.Last updated -133555TypeScriptMIT License
- -securityFlicense-qualityAn MCP server that allows users to generate, edit, and create variations of images through OpenAI's DALL-E API, supporting both DALL-E 2 and DALL-E 3 models.Last updated -2TypeScript
- AsecurityFlicenseAqualityAn MCP (Model Context Protocol) server that allows generating, editing, and creating variations of images using OpenAI's DALL-E APIs.Last updated -1TypeScript
- -securityAlicense-qualityProvides tools for generating and editing images using OpenAI's gpt-image-1 model via an MCP interface, enabling AI assistants to create and modify images based on text prompts.Last updated -10PythonApache 2.0