Servidor MCP de generación de imágenes OpenAI
Este proyecto implementa un servidor MCP (Protocolo de contexto de modelo) que proporciona herramientas para generar y editar imágenes utilizando el modelo gpt-image-1
de OpenAI a través del SDK oficial de Python.
Características
Este servidor MCP proporciona las siguientes herramientas:
generate_image
: genera una imagen utilizando el modelogpt-image-1
de OpenAI basado en un mensaje de texto y la guarda.Esquema de entrada:
{ "type": "object", "properties": { "prompt": { "type": "string", "description": "The text description of the desired image(s)." }, "model": { "type": "string", "default": "gpt-image-1", "description": "The model to use (currently 'gpt-image-1')." }, "n": { "type": ["integer", "null"], "default": 1, "description": "The number of images to generate (Default: 1)." }, "size": { "type": ["string", "null"], "enum": ["1024x1024", "1536x1024", "1024x1536", "auto"], "default": "auto", "description": "Image dimensions ('1024x1024', '1536x1024', '1024x1536', 'auto'). Default: 'auto'." }, "quality": { "type": ["string", "null"], "enum": ["low", "medium", "high", "auto"], "default": "auto", "description": "Rendering quality ('low', 'medium', 'high', 'auto'). Default: 'auto'." }, "user": { "type": ["string", "null"], "default": null, "description": "An optional unique identifier representing your end-user." }, "save_filename": { "type": ["string", "null"], "default": null, "description": "Optional filename (without extension). If None, a default name based on the prompt and timestamp is used." } }, "required": ["prompt"] }Salida:
{"status": "success", "saved_path": "path/to/image.png"}
o diccionario de errores.
edit_image
: Edita una imagen o crea variaciones usando el modelogpt-image-1
de OpenAI y la guarda. Permite usar varias imágenes de entrada como referencia o aplicar una máscara para retocar la imagen.Esquema de entrada:
{ "type": "object", "properties": { "prompt": { "type": "string", "description": "The text description of the desired final image or edit." }, "image_paths": { "type": "array", "items": { "type": "string" }, "description": "A list of file paths to the input image(s). Must be PNG. < 25MB." }, "mask_path": { "type": ["string", "null"], "default": null, "description": "Optional file path to the mask image (PNG with alpha channel) for inpainting. Must be same size as input image(s). < 25MB." }, "model": { "type": "string", "default": "gpt-image-1", "description": "The model to use (currently 'gpt-image-1')." }, "n": { "type": ["integer", "null"], "default": 1, "description": "The number of images to generate (Default: 1)." }, "size": { "type": ["string", "null"], "enum": ["1024x1024", "1536x1024", "1024x1536", "auto"], "default": "auto", "description": "Image dimensions ('1024x1024', '1536x1024', '1024x1536', 'auto'). Default: 'auto'." }, "quality": { "type": ["string", "null"], "enum": ["low", "medium", "high", "auto"], "default": "auto", "description": "Rendering quality ('low', 'medium', 'high', 'auto'). Default: 'auto'." }, "user": { "type": ["string", "null"], "default": null, "description": "An optional unique identifier representing your end-user." }, "save_filename": { "type": ["string", "null"], "default": null, "description": "Optional filename (without extension). If None, a default name based on the prompt and timestamp is used." } }, "required": ["prompt", "image_paths"] }Salida:
{"status": "success", "saved_path": "path/to/image.png"}
o diccionario de errores.
Prerrequisitos
Python (se recomienda 3.8 o posterior)
pip (instalador de paquetes de Python)
Una clave API de OpenAI (configurada directamente en el script o a través de la variable de entorno
OPENAI_API_KEY
; se recomienda enfáticamente utilizar variables de entorno por razones de seguridad ).Un entorno de cliente MCP (como el utilizado por Cline) capaz de gestionar y lanzar servidores MCP.
Instalación
Clonar el repositorio:
git clone https://github.com/IncomeStreamSurfer/chatgpt-native-image-gen-mcp.git cd chatgpt-native-image-gen-mcpConfigurar un entorno virtual (recomendado):
python -m venv venv source venv/bin/activate # On Windows use `venv\Scripts\activate`Instalar dependencias:
pip install -r requirements.txt(Opcional, pero recomendado) Configurar la variable de entorno: Establezca la variable de entorno
OPENAI_API_KEY
con su clave de OpenAI en lugar de codificarla en el script. La configuración depende de su sistema operativo.
Configuración (para el cliente Cline MCP)
Para que este servidor esté disponible para su asistente de IA (como Cline), agregue su configuración a su archivo de configuración de MCP (por ejemplo, cline_mcp_settings.json
).
Busque el objeto mcpServers
en su archivo de configuración y agregue la siguiente entrada:
Importante: Reemplace C:/path/to/your/cloned/repo/
con la ruta absoluta correcta a la ubicación donde clonó este repositorio en su equipo. Asegúrese de que el separador de ruta sea el correcto para su sistema operativo (por ejemplo, use barras invertidas \
en Windows). Si configura la clave API mediante una variable de entorno, puede eliminarla del script y posiblemente añadirla a la sección env
si su cliente MCP lo admite.
Ejecución del servidor
Normalmente no es necesario ejecutar el servidor manualmente. El cliente MCP (como Cline) iniciará automáticamente el servidor usando el command
y args
especificados en el archivo de configuración al llamar a una de sus herramientas por primera vez.
Si desea probarlo manualmente (asegúrese de que las dependencias estén instaladas y la clave API esté disponible):
Uso
El asistente de IA interactúa con el servidor mediante las herramientas generate_image
y edit_image
. Las imágenes se guardan en un subdirectorio ai-images
creado donde se encuentra el script openai_image_mcp.py
. Las herramientas devuelven la ruta absoluta de la imagen guardada si se completa correctamente.
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Proporciona herramientas para generar y editar imágenes utilizando el modelo gpt-image-1 de OpenAI a través de una interfaz MCP, lo que permite a los asistentes de IA crear y modificar imágenes según indicaciones de texto.
Related MCP Servers
- AsecurityAlicenseAqualityAllows AI assistants to generate and transform high-quality images from text prompts using Google's Gemini model via the MCP protocol.Last updated -323MIT License
- -securityAlicense-qualityAn MCP tool server that enables generating and editing images through OpenAI's image models, supporting text-to-image generation and advanced image editing (inpainting, outpainting) across various MCP-compatible clients.Last updated -75MIT License
- AsecurityAlicenseAqualityAn MCP server that allows Claude to use OpenAI's image generation capabilities (gpt-image-1) to create image assets for users, which is particularly useful for game and web development projects.Last updated -113MIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables generating and editing images using OpenAI's gpt-image-1 model, allowing AI assistants to create and modify images from text prompts.Last updated -24516MIT License