DALL-E MCP Server

by Garoth
Verified

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Integrations

  • Provides tools for generating, editing, and creating variations of images using OpenAI's DALL-E models, supporting both DALL-E 2 and DALL-E 3 with various customization options for image size, quality, and style.

Servidor DALL-E MCP

Un servidor MCP (Protocolo de contexto de modelo) para generar imágenes utilizando la API DALL-E de OpenAI.

Características

  • Generar imágenes utilizando DALL-E 2 o DALL-E 3
  • Editar imágenes existentes (solo DALL-E 2)
  • Crear variaciones de imágenes existentes (solo DALL-E 2)
  • Validar la clave API de OpenAI

Instalación

# Clone the repository git clone https://github.com/Garoth/dalle-mcp.git cd dalle-mcp # Install dependencies npm install # Build the project npm run build

Nota importante para los usuarios de Cline

Al usar este servidor DALL-E MCP con Cline, se recomienda guardar las imágenes generadas en el directorio de su espacio de trabajo actual. Para ello, configure el parámetro saveDir para que coincida con dicho directorio. Esto garantiza que Cline pueda localizar y mostrar correctamente las imágenes generadas en su conversación.

Ejemplo de uso con Cline:

{ "prompt": "A tropical beach at sunset", "saveDir": "/path/to/current/workspace" }

Uso

Ejecución del servidor

# Run the server node build/index.js

Configuración para Cline

Agregue el servidor dall-e a su archivo de configuración de Cline MCP dentro de la configuración de VSCode (por ejemplo, ~/.config/Code/User/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json):

{ "mcpServers": { "dalle-mcp": { "command": "node", "args": ["/path/to/dalle-mcp-server/build/index.js"], "env": { "OPENAI_API_KEY": "your-api-key-here", "SAVE_DIR": "/path/to/save/directory" }, "disabled": false, "autoApprove": [] } } }

Asegúrese de:

  1. Reemplace /path/to/dalle-mcp-server/build/index.js con la ruta real al archivo index.js creado
  2. Reemplace your-api-key-here con su clave API de OpenAI

Herramientas disponibles

generar_imagen

Genere una imagen usando DALL-E basándose en una indicación de texto.

{ "prompt": "A futuristic city with flying cars and neon lights", "model": "dall-e-3", "size": "1024x1024", "quality": "standard", "style": "vivid", "n": 1, "saveDir": "/path/to/save/directory", "fileName": "futuristic-city" }

Parámetros:

  • prompt (obligatorio): descripción de texto de la imagen deseada
  • model (opcional): modelo DALL-E a utilizar ("dall-e-2" o "dall-e-3", predeterminado: "dall-e-3")
  • size (opcional): Tamaño de la imagen generada (predeterminado: "1024x1024")
    • DALL-E 3: "1024x1024", "1792x1024" o "1024x1792"
    • DALL-E 2: "256x256", "512x512" o "1024x1024"
  • quality (opcional): Calidad de la imagen generada, solo DALL-E 3 ("estándar" o "hd", predeterminado: "estándar")
  • style (opcional): Estilo de la imagen generada, solo DALL-E 3 ("vívido" o "natural", predeterminado: "vívido")
  • n (opcional): Número de imágenes a generar (1-10, predeterminado: 1)
  • saveDir (opcional): Directorio donde se guardan las imágenes generadas (predeterminado: directorio actual o SAVE_DIR de .env). Para usuarios de Cline: Se recomienda configurarlo con el directorio actual de su espacio de trabajo para una correcta visualización de las imágenes.
  • fileName (opcional): nombre de archivo base para las imágenes generadas sin extensión (predeterminado: "dalle-{timestamp}")

editar_imagen

Edite una imagen existente utilizando DALL-E basándose en una indicación de texto.

⚠️ Problema conocido (18 de marzo de 2025): La API de edición de imágenes de DALL-E 2 presenta un error que, en ocasiones, ignora la solicitud y devuelve la imagen original sin modificaciones, incluso al usar imágenes y máscaras con el formato RGBA correcto. Este problema se ha reportado en el foro de la comunidad de OpenAI . Si experimenta este problema, pruebe con la herramienta create_variation , que parece funcionar con mayor fiabilidad.

{ "prompt": "Add a red hat", "imagePath": "/path/to/image.png", "mask": "/path/to/mask.png", "model": "dall-e-2", "size": "1024x1024", "n": 1, "saveDir": "/path/to/save/directory", "fileName": "edited-image" }

Parámetros:

  • prompt (obligatorio): descripción textual de las ediciones deseadas
  • imagePath (obligatorio): Ruta a la imagen a editar
  • mask (opcional): Ruta a la imagen de la máscara (se editarán las áreas blancas, se conservarán las áreas negras)
  • model (opcional): modelo DALL-E a utilizar (actualmente solo "dall-e-2" admite la edición, predeterminado: "dall-e-2")
  • size (opcional): Tamaño de la imagen generada (predeterminado: "1024x1024")
  • n (opcional): Número de imágenes a generar (1-10, predeterminado: 1)
  • saveDir (opcional): Directorio donde guardar las imágenes editadas (predeterminado: directorio actual o SAVE_DIR de .env). Para usuarios de Cline: Se recomienda configurarlo con el directorio actual de su espacio de trabajo para una correcta visualización de las imágenes.
  • fileName (opcional): nombre de archivo base para las imágenes editadas sin extensión (predeterminado: "dalle-edit-{timestamp}")

crear_variación

Cree variaciones de una imagen existente utilizando DALL-E.

{ "imagePath": "/path/to/image.png", "model": "dall-e-2", "size": "1024x1024", "n": 4, "saveDir": "/path/to/save/directory", "fileName": "image-variation" }

Parámetros:

  • imagePath (obligatorio): Ruta a la imagen para crear variaciones de
  • model (opcional): modelo DALL-E a utilizar (actualmente solo "dall-e-2" admite variaciones, predeterminado: "dall-e-2")
  • size (opcional): Tamaño de la imagen generada (predeterminado: "1024x1024")
  • n (opcional): Número de variaciones a generar (1-10, predeterminado: 1)
  • saveDir (opcional): Directorio donde guardar las imágenes de variación (predeterminado: directorio actual o SAVE_DIR de .env). Para usuarios de Cline: Se recomienda configurarlo con el directorio actual de su espacio de trabajo para una correcta visualización de las imágenes.
  • fileName (opcional): nombre de archivo base para las imágenes de variación sin extensión (predeterminado: "dalle-variation-{timestamp}")

validar_clave

Validar la clave API de OpenAI.

{}

No se requieren parámetros.

Desarrollo

Configuración de prueba

Nota: La siguiente configuración .env SÓLO es necesaria para ejecutar pruebas, no para el funcionamiento normal.

Si está desarrollando o ejecutando pruebas para este proyecto, cree un archivo .env en el directorio raíz con su clave API de OpenAI:

# Required for TESTS ONLY: OpenAI API Key OPENAI_API_KEY=your-api-key-here # Optional: Default save directory for test images # If not specified, images will be saved to the current directory # SAVE_DIR=/path/to/save/directory

Para un funcionamiento normal con Cline, configure su clave API en el JSON de configuración de MCP como se describe en la sección "Agregar a la configuración de MCP" más arriba.

Puede obtener su clave API desde la página de claves API de OpenAI .

Ejecución de pruebas

# Run basic tests npm test # Run all tests including edit and variation tests npm run test:all # Run tests in watch mode npm run test:watch # Run specific test by name npm run test:name "should validate API key"

Nota: Las pruebas utilizan llamadas API reales y pueden generar cargos en su cuenta OpenAI.

Generación de imágenes de prueba

El proyecto incluye un script para generar imágenes de prueba para desarrollo y pruebas:

# Generate a test image in the assets directory npm run generate-test-image

Esto creará una imagen de prueba simple en el directorio assets que puede usarse para probar las funciones de edición y variación.

Licencia

Instituto Tecnológico de Massachusetts (MIT)

-
security - not tested
F
license - not found
-
quality - not tested

Un servidor MCP que permite a los usuarios generar, editar y crear variaciones de imágenes a través de la API DALL-E de OpenAI, compatible con los modelos DALL-E 2 y DALL-E 3.

  1. Features
    1. Installation
      1. Important Note for Cline Users
        1. Usage
          1. Running the Server
          2. Configuration for Cline
          3. Available Tools
        2. Development
          1. Testing Configuration
            1. Running Tests
            2. Generating Test Images
          2. License
            ID: q5jyj6dv8f