Servidor MCP de generación de imágenes OpenAI
Este proyecto implementa un servidor MCP (Protocolo de contexto de modelo) que proporciona herramientas para generar y editar imágenes utilizando el modelo gpt-image-1
de OpenAI a través del SDK oficial de Python.
Características
Este servidor MCP proporciona las siguientes herramientas:
generate_image
: genera una imagen utilizando el modelogpt-image-1
de OpenAI basado en un mensaje de texto y la guarda.- Esquema de entrada:
- Salida:
{"status": "success", "saved_path": "path/to/image.png"}
o diccionario de errores.
- Esquema de entrada:
edit_image
: Edita una imagen o crea variaciones usando el modelogpt-image-1
de OpenAI y la guarda. Permite usar varias imágenes de entrada como referencia o aplicar una máscara para retocar la imagen.- Esquema de entrada:
- Salida:
{"status": "success", "saved_path": "path/to/image.png"}
o diccionario de errores.
- Esquema de entrada:
Prerrequisitos
- Python (se recomienda 3.8 o posterior)
- pip (instalador de paquetes de Python)
- Una clave API de OpenAI (configurada directamente en el script o a través de la variable de entorno
OPENAI_API_KEY
; se recomienda enfáticamente utilizar variables de entorno por razones de seguridad ). - Un entorno de cliente MCP (como el utilizado por Cline) capaz de gestionar y lanzar servidores MCP.
Instalación
- Clonar el repositorio:
- Configurar un entorno virtual (recomendado):
- Instalar dependencias:
- (Opcional, pero recomendado) Configurar la variable de entorno: Establezca la variable de entorno
OPENAI_API_KEY
con su clave de OpenAI en lugar de codificarla en el script. La configuración depende de su sistema operativo.
Configuración (para el cliente Cline MCP)
Para que este servidor esté disponible para su asistente de IA (como Cline), agregue su configuración a su archivo de configuración de MCP (por ejemplo, cline_mcp_settings.json
).
Busque el objeto mcpServers
en su archivo de configuración y agregue la siguiente entrada:
Importante: Reemplace C:/path/to/your/cloned/repo/
con la ruta absoluta correcta a la ubicación donde clonó este repositorio en su equipo. Asegúrese de que el separador de ruta sea el correcto para su sistema operativo (por ejemplo, use barras invertidas \
en Windows). Si configura la clave API mediante una variable de entorno, puede eliminarla del script y posiblemente añadirla a la sección env
si su cliente MCP lo admite.
Ejecución del servidor
Normalmente no es necesario ejecutar el servidor manualmente. El cliente MCP (como Cline) iniciará automáticamente el servidor usando el command
y args
especificados en el archivo de configuración al llamar a una de sus herramientas por primera vez.
Si desea probarlo manualmente (asegúrese de que las dependencias estén instaladas y la clave API esté disponible):
Uso
El asistente de IA interactúa con el servidor mediante las herramientas generate_image
y edit_image
. Las imágenes se guardan en un subdirectorio ai-images
creado donde se encuentra el script openai_image_mcp.py
. Las herramientas devuelven la ruta absoluta de la imagen guardada si se completa correctamente.
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Proporciona herramientas para generar y editar imágenes utilizando el modelo gpt-image-1 de OpenAI a través de una interfaz MCP, lo que permite a los asistentes de IA crear y modificar imágenes según indicaciones de texto.
Related MCP Servers
- AsecurityAlicenseAqualityEnables the generation of images using Together AI's models through an MCP server, supporting customizable parameters such as model selection, image dimensions, and output directory.Last updated -14JavaScriptMIT License
- AsecurityAlicenseAqualityA MCP server that enables Claude and other MCP-compatible assistants to generate images from text prompts using Together AI's image generation models.Last updated -12TypeScriptMIT License
- -securityAlicense-qualityA MCP server that integrates with Cursor IDE to generate images based on text descriptions using JiMeng AI, allowing users to create and save custom images directly within their development environment.Last updated -160PythonMIT License
- -securityFlicense-qualityAn MCP server that allows users to generate, edit, and create variations of images through OpenAI's DALL-E API, supporting both DALL-E 2 and DALL-E 3 models.Last updated -2TypeScript