Image Generation MCP Server

by Ichigo3766
Verified

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Integrations

  • Provides text-to-image generation capabilities by connecting to a Stable Diffusion WebUI instance, allowing image generation, model selection, and image upscaling through the API.

Servidor MCP de generación de imágenes

Un servidor MCP que proporciona capacidades de generación de texto a imagen mediante la API WebUI de difusión estable (ForgeUI/AUTOMATIC-1111).

Instalación

Prerrequisitos

  • Node.js
  • Acceso a una instancia de WebUI de Stable Diffusion con API habilitada
  • La interfaz web debe tener el indicador --api habilitado al iniciarse

Configuración

  1. Clonar el repositorio:
git clone https://github.com/Ichigo3766/image-gen-mcp.git cd image-gen-mcp
  1. Instalar dependencias:
npm install
  1. Construir el servidor:
npm run build
  1. Agregue la configuración del servidor a su entorno:
{ "mcpServers": { "image-gen": { "command": "node", "args": [ "/path/to/image-gen-mcp/build/index.js" ], "env": { "SD_WEBUI_URL": "http://your-sd-webui-url:7860", "SD_AUTH_USER": "your-username", // Optional: if authentication is enabled "SD_AUTH_PASS": "your-password", // Optional: if authentication is enabled "SD_OUTPUT_DIR": "/path/to/output/directory", "SD_RESIZE_MODE": "0", // Optional: upscaling mode (0=multiplier, 1=dimensions) "SD_UPSCALE_MULTIPLIER": "4", // Optional: default upscale multiplier "SD_UPSCALE_WIDTH": "512", // Optional: default upscale width "SD_UPSCALE_HEIGHT": "512", // Optional: default upscale height "SD_UPSCALER_1": "R-ESRGAN 4x+", // Optional: default primary upscaler "SD_UPSCALER_2": "None" // Optional: default secondary upscaler } } } }

Reemplace las variables de entorno con sus valores:

  • SD_WEBUI_URL : URL de su instancia de WebUI de Stable Diffusion
  • SD_AUTH_USER : Nombre de usuario para autenticación básica (si está habilitada)
  • SD_AUTH_PASS : Contraseña para autenticación básica (si está habilitada)
  • SD_OUTPUT_DIR : Directorio donde se guardarán las imágenes generadas
  • SD_RESIZE_MODE : Modo de aumento de escala predeterminado (0 para multiplicador, 1 para dimensiones)
  • SD_UPSCALE_MULTIPLIER : Multiplicador de aumento de escala predeterminado cuando resize_mode es 0
  • SD_UPSCALE_WIDTH : Ancho de destino predeterminado cuando resize_mode es 1
  • SD_UPSCALE_HEIGHT : Altura de destino predeterminada cuando resize_mode es 1
  • SD_UPSCALER_1 : Modelo de escalador principal predeterminado
  • SD_UPSCALER_2 : Modelo de escalador secundario predeterminado

Características

Herramientas

  • generate_image - Genera imágenes usando difusión estable
    • Parámetros:
      • prompt (obligatorio): descripción de texto de la imagen deseada
      • negative_prompt : Cosas a excluir de la imagen
      • steps : Número de pasos de muestreo (predeterminado: 4, rango: 1-150)
      • width : Ancho de la imagen (predeterminado: 1024, rango: 512-2048)
      • height : Altura de la imagen (predeterminado: 1024, rango: 512-2048)
      • cfg_scale : escala CFG (predeterminado: 1, rango: 1-30)
      • sampler_name : Algoritmo de muestreo (predeterminado: "Euler")
      • scheduler_name : Algoritmo del programador (predeterminado: "Simple")
      • seed : semilla aleatoria (-1 para aleatorio)
      • batch_size : Número de imágenes a generar (predeterminado: 1, máximo: 4)
      • restore_faces : Habilitar la restauración de rostros
      • tiling : generar imágenes en mosaico
      • output_path : Ruta de salida personalizada para la imagen generada
  • get_sd_models - Obtener la lista de modelos de difusión estable disponibles
    • No se requieren parámetros
    • Devuelve una matriz de nombres de modelos
  • set_sd_model - Establece el modelo de difusión estable activo
    • Parámetros:
      • model_name (obligatorio): Nombre del modelo que se establecerá como activo
  • get_sd_upscalers - Obtener la lista de modelos de escalador disponibles
    • No se requieren parámetros
    • Devuelve una matriz de nombres de escaladores
  • upscale_images - Mejora la escala de una o más imágenes usando difusión estable
    • Parámetros:
      • images (obligatorio): Matriz de rutas de archivos de imágenes para ampliar
      • resize_mode : 0 para el modo multiplicador, 1 para el modo de dimensión (predeterminado: desde env)
      • upscaling_resize : Multiplicador de aumento de escala cuando resize_mode=0 (predeterminado: desde env)
      • upscaling_resize_w : Ancho objetivo en píxeles cuando resize_mode=1 (predeterminado: desde env)
      • upscaling_resize_h : Altura objetivo en píxeles cuando resize_mode=1 (predeterminado: desde env)
      • upscaler_1 : Modelo de escalador principal (predeterminado: del entorno)
      • upscaler_2 : Modelo de escalador secundario (predeterminado: del entorno)
      • output_path : Directorio de salida personalizado para imágenes escaladas

Desarrollo

Para desarrollo con reconstrucción automática:

npm run watch

Manejo de errores

Problemas comunes y soluciones:

  1. Asegúrese de que su interfaz web de difusión estable se esté ejecutando con el indicador --api
  2. Comprueba si la URL de la interfaz web es accesible desde donde estás ejecutando el servidor MCP
  3. Si utiliza autenticación, asegúrese de que las credenciales sean correctas
  4. Verifique que el directorio de salida exista y tenga permisos de escritura
  5. Al ampliar, asegúrese de que los archivos de imagen de entrada existan y sean legibles

Licencia

Este servidor MCP cuenta con la licencia MIT. Esto significa que puede usar, modificar y distribuir el software libremente, sujeto a los términos y condiciones de la licencia MIT. Para más detalles, consulte el archivo de LICENCIA en el repositorio del proyecto.

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Un servidor MCP que se integra con Stable Diffusion WebUI para proporcionar capacidades de generación de texto a imagen y ampliación de imágenes a través de simples llamadas API.

  1. Installation
    1. Prerequisites
    2. Setup
  2. Features
    1. Tools
  3. Development
    1. Error Handling
      1. License
        ID: o3a86vil7b