OpenAI GPT Image MCP

Integrations

  • Provides tools for generating and editing images using OpenAI's GPT-4o/gpt-image-1 APIs, supporting text-to-image generation, image editing operations (inpainting, outpainting, compositing), and advanced prompt control.

openai-gpt-image-mcp


OpenAI의 GPT-4o/gpt-image-1 이미지 생성 및 편집 API를 위한 모델 컨텍스트 프로토콜(MCP) 도구 서버입니다.

  • OpenAI의 최신 모델을 사용하여 텍스트 프롬프트에서 이미지를 생성합니다 .
  • 고급 프롬프트 제어를 사용하여 이미지를 편집 (인페인팅, 아웃페인팅, 합성)합니다.
  • 지원 대상 : Claude Desktop, Cursor, VSCode, Windsurf 및 모든 MCP 호환 클라이언트.

✨ 특징

  • create-image : 고급 옵션(크기, 품질, 배경 등)을 사용하여 프롬프트에서 이미지를 생성합니다.
  • edit-image : 프롬프트와 선택적 마스크를 사용하여 이미지를 편집하거나 확장하며 파일 경로와 base64 입력을 모두 지원합니다.
  • 파일 출력 : 생성된 이미지를 디스크에 직접 저장하거나 base64로 수신합니다.

🚀 설치

지엑스피1


🔑 구성

Claude Desktop 또는 VSCode(Cursor/Windsurf 포함) 구성에 추가:

{ "mcpServers": { "openai-gpt-image-mcp": { "command": "node", "args": ["/absolute/path/to/dist/index.js"], "env": { "OPENAI_API_KEY": "sk-..." } } } }

⚡ 고급

  • create-image 의 경우 n 설정하면 최대 10개의 이미지를 한 번에 생성할 수 있습니다.
  • edit-image 의 경우, 편집 내용을 적용할 위치를 제어하기 위해 마스크 이미지(파일 경로 또는 base64)를 제공합니다.
  • 모든 옵션은 src/index.ts 참조하세요.

🧑‍💻 개발

  • TypeScript 소스: src/index.ts
  • 빌드: yarn build
  • 실행: node dist/index.js

📝 라이센스

MIT


🩺 문제 해결

  • OPENAI_API_KEY 가 유효하고 이미지 API 액세스 권한이 있는지 확인하세요.
  • 인증된 OpenAI 조직이 있어야 합니다. 인증 후 이미지 API 액세스가 활성화되기까지 15~20분이 소요될 수 있습니다.
  • 파일 경로는 절대 경로여야 합니다.
  • 파일 출력의 경우 디렉토리가 쓰기 가능한지 확인하세요.
  • 파일 형식에 대한 오류가 표시되면 이미지 파일 확장자와 형식을 확인하세요.

⚠️ 제한 사항 및 대용량 파일 처리

  • 1MB 페이로드 제한: MCP 클라이언트(Claude Desktop 포함)는 도구 응답에 대해 1MB의 제한을 두고 있습니다. 큰 이미지(특히 고해상도 또는 여러 이미지)를 base64로 반환하는 경우 이 제한을 쉽게 초과할 수 있습니다.
  • 파일 출력으로 자동 전환: 전체 이미지 크기가 1MB를 초과하면 도구가 자동으로 이미지를 디스크에 저장하고 base64 대신 파일 경로를 반환합니다. 이를 통해 호환성을 보장하고 result exceeds maximum length of 1048576 과 같은 오류를 방지합니다.
  • 기본 파일 위치: file_output 경로를 지정하지 않으면 이미지는 고유한 파일 이름으로 /tmp (또는 MCP_HF_WORK_DIR 환경 변수로 설정한 디렉토리)에 저장됩니다.
  • 환경 변수:
    • MCP_HF_WORK_DIR : 대용량 이미지와 파일 출력이 저장되는 위치를 제어합니다. 예: export MCP_HF_WORK_DIR=/your/desired/dir
  • 모범 사례: 대용량 이미지나 프로덕션 이미지의 경우 항상 파일 출력을 사용하고 클라이언트가 파일 경로를 처리하도록 구성되어 있는지 확인하세요.

📚 참고문헌


🙏 크레딧

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

OpenAI의 이미지 모델을 통해 이미지를 생성하고 편집할 수 있는 MCP 도구 서버로, 다양한 MCP 호환 클라이언트에서 텍스트-이미지 생성과 고급 이미지 편집(인페인팅, 아웃페인팅)을 지원합니다.

  1. ✨ Features
    1. 🚀 Installation
      1. 🔑 Configuration
        1. ⚡ Advanced
          1. 🧑‍💻 Development
            1. 📝 License
              1. 🩺 Troubleshooting
                1. ⚠️ Limitations & Large File Handling
                  1. 📚 References
                    1. 🙏 Credits

                      Related MCP Servers

                      • -
                        security
                        A
                        license
                        -
                        quality
                        An MCP server for analyzing images using OpenRouter vision models, offering capabilities like automatic image resizing, model configuration, and handling custom queries about images.
                        Last updated -
                        5
                        JavaScript
                        MIT License
                      • A
                        security
                        A
                        license
                        A
                        quality
                        An MCP Server that integrates with Stability AI's API to provide high-quality image generation, editing, and manipulation capabilities including background removal, outpainting, search-and-replace, and upscaling.
                        Last updated -
                        13
                        35
                        55
                        TypeScript
                        MIT License
                        • Apple
                      • -
                        security
                        F
                        license
                        -
                        quality
                        An MCP server that allows users to generate, edit, and create variations of images through OpenAI's DALL-E API, supporting both DALL-E 2 and DALL-E 3 models.
                        Last updated -
                        2
                        TypeScript
                      • -
                        security
                        -
                        license
                        -
                        quality
                        A TypeScript-based MCP server that lets users generate images using OpenAI's dall-e-3 model by providing a prompt and image name.
                        Last updated -
                        1

                      View all related MCP servers

                      ID: 436idj4xa1