OpenAI GPT Image MCP

Integrations

  • Provides tools for generating and editing images using OpenAI's GPT-4o/gpt-image-1 APIs, supporting text-to-image generation, image editing operations (inpainting, outpainting, compositing), and advanced prompt control.

imagen openai-gpt-mcp


Un servidor de herramientas de Protocolo de Contexto de Modelo (MCP) para las API de generación y edición de imágenes GPT-4o/gpt-image-1 de OpenAI.

  • Genere imágenes a partir de indicaciones de texto utilizando los últimos modelos de OpenAI.
  • Edite imágenes (relleno, acabado, composición) con control de indicaciones avanzado.
  • Admite : Claude Desktop, Cursor, VSCode, Windsurf y cualquier cliente compatible con MCP.

✨ Características

  • create-image : Genera imágenes a partir de un mensaje, con opciones avanzadas (tamaño, calidad, fondo, etc.).
  • edit-image : edita o extiende imágenes usando un mensaje y una máscara opcional, admitiendo tanto rutas de archivo como entrada base64.
  • Salida de archivo : guarde las imágenes generadas directamente en el disco o recíbalas como base64.

🚀 Instalación

git clone https://github.com/SureScaleAI/openai-gpt-image-mcp.git cd openai-gpt-image-mcp yarn install yarn build

🔑 Configuración

Agregar a la configuración de Claude Desktop o VSCode (incluido Cursor/Windsurf):

{ "mcpServers": { "openai-gpt-image-mcp": { "command": "node", "args": ["/absolute/path/to/dist/index.js"], "env": { "OPENAI_API_KEY": "sk-..." } } } }

⚡ Avanzado

  • Para create-image , configure n para generar hasta 10 imágenes a la vez.
  • Para edit-image , proporcione una imagen de máscara (ruta de archivo o base64) para controlar dónde se aplican las ediciones.
  • Consulte src/index.ts para ver todas las opciones.

🧑‍💻 Desarrollo

  • Fuente de TypeScript: src/index.ts
  • Construcción: yarn build
  • Ejecutar: node dist/index.js

📝 Licencia

Instituto Tecnológico de Massachusetts (MIT)


🩺 Solución de problemas

  • Asegúrese de que su OPENAI_API_KEY sea válida y tenga acceso a la API de imágenes.
  • Debe tener una organización OpenAI verificada . Tras la verificación, la activación del acceso a la API de imágenes puede tardar entre 15 y 20 minutos.
  • Las rutas de archivo deben ser absolutas.
  • Para la salida de archivo, asegúrese de que el directorio sea escribible.
  • Si ve errores sobre los tipos de archivos, verifique las extensiones y formatos de sus archivos de imagen.

⚠️ Limitaciones y manejo de archivos grandes

  • Límite de carga útil de 1 MB: Los clientes MCP (incluido Claude Desktop) tienen un límite estricto de 1 MB para las respuestas de la herramienta. Las imágenes grandes (especialmente las de alta resolución o múltiples imágenes) pueden superar fácilmente este límite si se devuelven en base64.
  • Cambio automático a salida de archivo: Si el tamaño total de la imagen supera 1 MB, la herramienta guardará automáticamente las imágenes en el disco y devolverá la(s) ruta(s) del archivo en lugar de base64. Esto garantiza la compatibilidad y evita errores como result exceeds maximum length of 1048576 .
  • Ubicación de archivo predeterminada: si no especifica una ruta file_output , las imágenes se guardarán en /tmp (o en el directorio establecido por la variable de entorno MCP_HF_WORK_DIR ) con un nombre de archivo único.
  • Variable de entorno:
    • MCP_HF_WORK_DIR : Configure esta opción para controlar dónde se guardan las imágenes grandes y los archivos de salida. Ejemplo: export MCP_HF_WORK_DIR=/your/desired/dir
  • Práctica recomendada: para imágenes grandes o de producción, utilice siempre la salida de archivo y asegúrese de que su cliente esté configurado para manejar rutas de archivos.

📚 Referencias


🙏 Créditos

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Un servidor de herramientas MCP que permite generar y editar imágenes a través de los modelos de imágenes de OpenAI, admitiendo la generación de texto a imagen y la edición avanzada de imágenes (relleno, relleno) en varios clientes compatibles con MCP.

  1. ✨ Features
    1. 🚀 Installation
      1. 🔑 Configuration
        1. ⚡ Advanced
          1. 🧑‍💻 Development
            1. 📝 License
              1. 🩺 Troubleshooting
                1. ⚠️ Limitations & Large File Handling
                  1. 📚 References
                    1. 🙏 Credits

                      Related MCP Servers

                      • -
                        security
                        A
                        license
                        -
                        quality
                        An MCP server for analyzing images using OpenRouter vision models, offering capabilities like automatic image resizing, model configuration, and handling custom queries about images.
                        Last updated -
                        5
                        JavaScript
                        MIT License
                      • A
                        security
                        A
                        license
                        A
                        quality
                        An MCP Server that integrates with Stability AI's API to provide high-quality image generation, editing, and manipulation capabilities including background removal, outpainting, search-and-replace, and upscaling.
                        Last updated -
                        13
                        35
                        55
                        TypeScript
                        MIT License
                        • Apple
                      • -
                        security
                        F
                        license
                        -
                        quality
                        An MCP server that allows users to generate, edit, and create variations of images through OpenAI's DALL-E API, supporting both DALL-E 2 and DALL-E 3 models.
                        Last updated -
                        2
                        TypeScript
                      • -
                        security
                        -
                        license
                        -
                        quality
                        A TypeScript-based MCP server that lets users generate images using OpenAI's dall-e-3 model by providing a prompt and image name.
                        Last updated -
                        1

                      View all related MCP servers

                      ID: 436idj4xa1