imagen openai-gpt-mcp
Un servidor de herramientas de Protocolo de Contexto de Modelo (MCP) para las API de generación y edición de imágenes GPT-4o/gpt-image-1 de OpenAI.
- Genere imágenes a partir de indicaciones de texto utilizando los últimos modelos de OpenAI.
- Edite imágenes (relleno, acabado, composición) con control de indicaciones avanzado.
- Admite : Claude Desktop, Cursor, VSCode, Windsurf y cualquier cliente compatible con MCP.
✨ Características
- create-image : Genera imágenes a partir de un mensaje, con opciones avanzadas (tamaño, calidad, fondo, etc.).
- edit-image : edita o extiende imágenes usando un mensaje y una máscara opcional, admitiendo tanto rutas de archivo como entrada base64.
- Salida de archivo : guarde las imágenes generadas directamente en el disco o recíbalas como base64.
🚀 Instalación
🔑 Configuración
Agregar a la configuración de Claude Desktop o VSCode (incluido Cursor/Windsurf):
⚡ Avanzado
- Para
create-image
, configuren
para generar hasta 10 imágenes a la vez. - Para
edit-image
, proporcione una imagen de máscara (ruta de archivo o base64) para controlar dónde se aplican las ediciones. - Consulte
src/index.ts
para ver todas las opciones.
🧑💻 Desarrollo
- Fuente de TypeScript:
src/index.ts
- Construcción:
yarn build
- Ejecutar:
node dist/index.js
📝 Licencia
Instituto Tecnológico de Massachusetts (MIT)
🩺 Solución de problemas
- Asegúrese de que su
OPENAI_API_KEY
sea válida y tenga acceso a la API de imágenes. - Debe tener una organización OpenAI verificada . Tras la verificación, la activación del acceso a la API de imágenes puede tardar entre 15 y 20 minutos.
- Las rutas de archivo deben ser absolutas.
- Para la salida de archivo, asegúrese de que el directorio sea escribible.
- Si ve errores sobre los tipos de archivos, verifique las extensiones y formatos de sus archivos de imagen.
⚠️ Limitaciones y manejo de archivos grandes
- Límite de carga útil de 1 MB: Los clientes MCP (incluido Claude Desktop) tienen un límite estricto de 1 MB para las respuestas de la herramienta. Las imágenes grandes (especialmente las de alta resolución o múltiples imágenes) pueden superar fácilmente este límite si se devuelven en base64.
- Cambio automático a salida de archivo: Si el tamaño total de la imagen supera 1 MB, la herramienta guardará automáticamente las imágenes en el disco y devolverá la(s) ruta(s) del archivo en lugar de base64. Esto garantiza la compatibilidad y evita errores como
result exceeds maximum length of 1048576
. - Ubicación de archivo predeterminada: si no especifica una ruta
file_output
, las imágenes se guardarán en/tmp
(o en el directorio establecido por la variable de entornoMCP_HF_WORK_DIR
) con un nombre de archivo único. - Variable de entorno:
MCP_HF_WORK_DIR
: Configure esta opción para controlar dónde se guardan las imágenes grandes y los archivos de salida. Ejemplo:export MCP_HF_WORK_DIR=/your/desired/dir
- Práctica recomendada: para imágenes grandes o de producción, utilice siempre la salida de archivo y asegúrese de que su cliente esté configurado para manejar rutas de archivos.
📚 Referencias
🙏 Créditos
- Creado con @modelcontextprotocol/sdk
- Utiliza el SDK de Node.js de Openai
- Desarrollado por SureScale.ai
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Un servidor de herramientas MCP que permite generar y editar imágenes a través de los modelos de imágenes de OpenAI, admitiendo la generación de texto a imagen y la edición avanzada de imágenes (relleno, relleno) en varios clientes compatibles con MCP.
Related MCP Servers
- -securityFlicense-qualityAn MCP server that allows users to generate, edit, and create variations of images through OpenAI's DALL-E API, supporting both DALL-E 2 and DALL-E 3 models.Last updated -2TypeScript
- AsecurityFlicenseAqualityAn MCP (Model Context Protocol) server that allows generating, editing, and creating variations of images using OpenAI's DALL-E APIs.Last updated -1TypeScript
- -securityAlicense-qualityProvides tools for generating and editing images using OpenAI's gpt-image-1 model via an MCP interface, enabling AI assistants to create and modify images based on text prompts.Last updated -10PythonApache 2.0
- AsecurityAlicenseAqualityAn MCP server that allows Claude to use OpenAI's image generation capabilities (gpt-image-1) to create image assets for users, which is particularly useful for game and web development projects.Last updated -1JavaScriptMIT License