Image Generation MCP Server

by Ichigo3766
Verified

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Integrations

  • Provides text-to-image generation capabilities by connecting to a Stable Diffusion WebUI instance, allowing image generation, model selection, and image upscaling through the API.

이미지 생성 MCP 서버

Stable Diffusion WebUI API(ForgeUI/AUTOMATIC-1111)를 사용하여 텍스트-이미지 생성 기능을 제공하는 MCP 서버입니다.

설치

필수 조건

  • 노드.js
  • API가 활성화된 안정적인 Diffusion WebUI 인스턴스에 액세스
  • WebUI를 시작할 때 --api 플래그가 활성화되어 있어야 합니다.

설정

  1. 저장소를 복제합니다.

지엑스피1

  1. 종속성 설치:
npm install
  1. 서버를 빌드하세요:
npm run build
  1. 환경에 서버 구성을 추가합니다.
{ "mcpServers": { "image-gen": { "command": "node", "args": [ "/path/to/image-gen-mcp/build/index.js" ], "env": { "SD_WEBUI_URL": "http://your-sd-webui-url:7860", "SD_AUTH_USER": "your-username", // Optional: if authentication is enabled "SD_AUTH_PASS": "your-password", // Optional: if authentication is enabled "SD_OUTPUT_DIR": "/path/to/output/directory", "SD_RESIZE_MODE": "0", // Optional: upscaling mode (0=multiplier, 1=dimensions) "SD_UPSCALE_MULTIPLIER": "4", // Optional: default upscale multiplier "SD_UPSCALE_WIDTH": "512", // Optional: default upscale width "SD_UPSCALE_HEIGHT": "512", // Optional: default upscale height "SD_UPSCALER_1": "R-ESRGAN 4x+", // Optional: default primary upscaler "SD_UPSCALER_2": "None" // Optional: default secondary upscaler } } } }

환경 변수를 해당 값으로 바꾸세요.

  • SD_WEBUI_URL : Stable Diffusion WebUI 인스턴스의 URL
  • SD_AUTH_USER : 기본 인증을 위한 사용자 이름(활성화된 경우)
  • SD_AUTH_PASS : 기본 인증을 위한 비밀번호(활성화된 경우)
  • SD_OUTPUT_DIR : 생성된 이미지가 저장될 디렉토리
  • SD_RESIZE_MODE : 기본 업스케일링 모드(배율의 경우 0, 차원의 경우 1)
  • SD_UPSCALE_MULTIPLIER : resize_mode가 0일 때 기본 업스케일 배수
  • SD_UPSCALE_WIDTH : resize_mode가 1일 때 기본 대상 너비
  • SD_UPSCALE_HEIGHT : resize_mode가 1일 때 기본 대상 높이
  • SD_UPSCALER_1 : 기본 기본 업스케일러 모델
  • SD_UPSCALER_2 : 기본 보조 업스케일러 모델

특징

도구

  • generate_image - 안정 확산을 사용하여 이미지 생성
    • 매개변수:
      • prompt (필수): 원하는 이미지에 대한 텍스트 설명
      • negative_prompt : 이미지에서 제외할 항목
      • steps : 샘플링 단계 수(기본값: 4, 범위: 1-150)
      • width : 이미지 너비(기본값: 1024, 범위: 512-2048)
      • height : 이미지 높이(기본값: 1024, 범위: 512-2048)
      • cfg_scale : CFG 스케일(기본값: 1, 범위: 1-30)
      • sampler_name : 샘플링 알고리즘(기본값: "Euler")
      • scheduler_name : 스케줄러 알고리즘(기본값: "단순")
      • seed : 무작위 시드(무작위의 경우 -1)
      • batch_size : 생성할 이미지 수 (기본값: 1, 최대값: 4)
      • restore_faces : 얼굴 복원을 활성화합니다.
      • tiling : 타일링 가능한 이미지 생성
      • output_path : 생성된 이미지에 대한 사용자 정의 출력 경로
  • get_sd_models - 사용 가능한 안정 확산 모델 목록 가져오기
    • 매개변수가 필요하지 않습니다
    • 모델 이름 배열을 반환합니다.
  • set_sd_model - 활성 안정 확산 모델 설정
    • 매개변수:
      • model_name (필수): 활성으로 설정할 모델의 이름
  • get_sd_upscalers - 사용 가능한 업스케일러 모델 목록 가져오기
    • 매개변수가 필요하지 않습니다
    • 업스케일러 이름 배열을 반환합니다.
  • upscale_images - 안정적 확산을 사용하여 하나 이상의 이미지 확대
    • 매개변수:
      • images (필수): 업스케일할 이미지 파일 경로 배열
      • resize_mode : 승수 모드의 경우 0, 차원 모드의 경우 1(기본값: env에서)
      • upscaling_resize : resize_mode=0일 때 확장 배수(기본값: env에서)
      • upscaling_resize_w : resize_mode=1일 때 대상 너비(픽셀) (기본값: env에서)
      • upscaling_resize_h : resize_mode=1일 때 대상 높이(픽셀) (기본값: env에서)
      • upscaler_1 : 기본 업스케일러 모델(기본값: env에서)
      • upscaler_2 : 보조 업스케일러 모델(기본값: env에서)
      • output_path : 확장된 이미지를 위한 사용자 정의 출력 디렉토리

개발

자동 재빌드를 사용한 개발의 경우:

npm run watch

오류 처리

일반적인 문제 및 해결 방법:

  1. --api 플래그를 사용하여 Stable Diffusion WebUI가 실행 중인지 확인하세요.
  2. MCP 서버를 실행 중인 위치에서 WebUI URL에 액세스할 수 있는지 확인하세요.
  3. 인증을 사용하는 경우 자격 증명이 올바른지 확인하세요.
  4. 출력 디렉토리가 존재하고 쓰기 권한이 있는지 확인하세요.
  5. 업스케일링 시 입력 이미지 파일이 존재하고 읽을 수 있는지 확인하십시오.

특허

이 MCP 서버는 MIT 라이선스에 따라 라이선스가 부여됩니다. 즉, MIT 라이선스의 약관에 따라 소프트웨어를 자유롭게 사용, 수정 및 배포할 수 있습니다. 자세한 내용은 프로젝트 저장소의 LICENSE 파일을 참조하세요.

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Stable Diffusion WebUI와 통합되어 간단한 API 호출을 통해 텍스트-이미지 생성 및 이미지 업스케일링 기능을 제공하는 MCP 서버입니다.

  1. Installation
    1. Prerequisites
    2. Setup
  2. Features
    1. Tools
  3. Development
    1. Error Handling
      1. License
        ID: o3a86vil7b