Integrations
Provides tools for generating and editing images using OpenAI's GPT-4o/gpt-image-1 APIs, supporting text-to-image generation, image editing operations (inpainting, outpainting, compositing), and advanced prompt control.
imagen openai-gpt-mcp
Un servidor de herramientas de Protocolo de Contexto de Modelo (MCP) para las API de generación y edición de imágenes GPT-4o/gpt-image-1 de OpenAI.
- Genere imágenes a partir de indicaciones de texto utilizando los últimos modelos de OpenAI.
- Edite imágenes (relleno, acabado, composición) con control de indicaciones avanzado.
- Admite : Claude Desktop, Cursor, VSCode, Windsurf y cualquier cliente compatible con MCP.
✨ Características
- create-image : Genera imágenes a partir de un mensaje, con opciones avanzadas (tamaño, calidad, fondo, etc.).
- edit-image : edita o extiende imágenes usando un mensaje y una máscara opcional, admitiendo tanto rutas de archivo como entrada base64.
- Salida de archivo : guarde las imágenes generadas directamente en el disco o recíbalas como base64.
🚀 Instalación
🔑 Configuración
Agregar a la configuración de Claude Desktop o VSCode (incluido Cursor/Windsurf):
⚡ Avanzado
- Para
create-image
, configuren
para generar hasta 10 imágenes a la vez. - Para
edit-image
, proporcione una imagen de máscara (ruta de archivo o base64) para controlar dónde se aplican las ediciones. - Consulte
src/index.ts
para ver todas las opciones.
🧑💻 Desarrollo
- Fuente de TypeScript:
src/index.ts
- Construcción:
yarn build
- Ejecutar:
node dist/index.js
📝 Licencia
Instituto Tecnológico de Massachusetts (MIT)
🩺 Solución de problemas
- Asegúrese de que su
OPENAI_API_KEY
sea válida y tenga acceso a la API de imágenes. - Debe tener una organización OpenAI verificada . Tras la verificación, la activación del acceso a la API de imágenes puede tardar entre 15 y 20 minutos.
- Las rutas de archivo deben ser absolutas.
- Para la salida de archivo, asegúrese de que el directorio sea escribible.
- Si ve errores sobre los tipos de archivos, verifique las extensiones y formatos de sus archivos de imagen.
⚠️ Limitaciones y manejo de archivos grandes
- Límite de carga útil de 1 MB: Los clientes MCP (incluido Claude Desktop) tienen un límite estricto de 1 MB para las respuestas de la herramienta. Las imágenes grandes (especialmente las de alta resolución o múltiples imágenes) pueden superar fácilmente este límite si se devuelven en base64.
- Cambio automático a salida de archivo: Si el tamaño total de la imagen supera 1 MB, la herramienta guardará automáticamente las imágenes en el disco y devolverá la(s) ruta(s) del archivo en lugar de base64. Esto garantiza la compatibilidad y evita errores como
result exceeds maximum length of 1048576
. - Ubicación de archivo predeterminada: si no especifica una ruta
file_output
, las imágenes se guardarán en/tmp
(o en el directorio establecido por la variable de entornoMCP_HF_WORK_DIR
) con un nombre de archivo único. - Variable de entorno:
MCP_HF_WORK_DIR
: Configure esta opción para controlar dónde se guardan las imágenes grandes y los archivos de salida. Ejemplo:export MCP_HF_WORK_DIR=/your/desired/dir
- Práctica recomendada: para imágenes grandes o de producción, utilice siempre la salida de archivo y asegúrese de que su cliente esté configurado para manejar rutas de archivos.
📚 Referencias
🙏 Créditos
- Creado con @modelcontextprotocol/sdk
- Utiliza el SDK de Node.js de Openai
- Desarrollado por SureScale.ai
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Un servidor de herramientas MCP que permite generar y editar imágenes a través de los modelos de imágenes de OpenAI, admitiendo la generación de texto a imagen y la edición avanzada de imágenes (relleno, relleno) en varios clientes compatibles con MCP.
Related MCP Servers
- -securityAlicense-qualityAn MCP server for analyzing images using OpenRouter vision models, offering capabilities like automatic image resizing, model configuration, and handling custom queries about images.Last updated -5JavaScriptMIT License
- AsecurityAlicenseAqualityAn MCP Server that integrates with Stability AI's API to provide high-quality image generation, editing, and manipulation capabilities including background removal, outpainting, search-and-replace, and upscaling.Last updated -133555TypeScriptMIT License
- -securityFlicense-qualityAn MCP server that allows users to generate, edit, and create variations of images through OpenAI's DALL-E API, supporting both DALL-E 2 and DALL-E 3 models.Last updated -2TypeScript
- -security-license-qualityA TypeScript-based MCP server that lets users generate images using OpenAI's dall-e-3 model by providing a prompt and image name.Last updated -1