OpenAI GPT Image MCP

by SureScaleAI
Integrations
  • Provides tools for generating and editing images using OpenAI's GPT-4o/gpt-image-1 APIs, supporting text-to-image generation, image editing operations (inpainting, outpainting, compositing), and advanced prompt control.

openai-gpt-image-mcp


Ein Model Context Protocol (MCP)-Toolserver für die GPT-4o/gpt-image-1-APIs zur Bildgenerierung und -bearbeitung von OpenAI.

  • Generieren Sie Bilder aus Textaufforderungen mithilfe der neuesten Modelle von OpenAI.
  • Bearbeiten Sie Bilder (Inpainting, Outpainting, Compositing) mit erweiterter Eingabeaufforderungssteuerung.
  • Unterstützt : Claude Desktop, Cursor, VSCode, Windsurf und jeden MCP-kompatiblen Client.

✨ Funktionen

  • create-image : Generieren Sie Bilder aus einer Eingabeaufforderung mit erweiterten Optionen (Größe, Qualität, Hintergrund usw.).
  • Bild bearbeiten : Bearbeiten oder erweitern Sie Bilder mithilfe einer Eingabeaufforderung und einer optionalen Maske. Dabei werden sowohl Dateipfade als auch Base64-Eingaben unterstützt.
  • Dateiausgabe : Speichern Sie generierte Bilder direkt auf der Festplatte oder empfangen Sie sie als Base64.

🚀 Installation

git clone https://github.com/SureScaleAI/openai-gpt-image-mcp.git cd openai-gpt-image-mcp yarn install yarn build

🔑 Konfiguration

Zur Claude Desktop- oder VSCode-Konfiguration (einschließlich Cursor/Windsurf) hinzufügen:

{ "mcpServers": { "openai-gpt-image-mcp": { "command": "node", "args": ["/absolute/path/to/dist/index.js"], "env": { "OPENAI_API_KEY": "sk-..." } } } }

⚡ Fortgeschritten

  • Legen Sie für create-image den Wert n fest, um bis zu 10 Bilder gleichzeitig zu generieren.
  • Geben Sie für edit-image ein Maskenbild (Dateipfad oder Base64) an, um zu steuern, wo Änderungen angewendet werden.
  • Alle Optionen finden Sie unter src/index.ts .

🧑‍💻 Entwicklung

  • TypeScript-Quelle: src/index.ts
  • Aufbau: yarn build
  • Ausführen: node dist/index.js

📝 Lizenz

MIT


🩺 Fehlerbehebung

  • Stellen Sie sicher, dass Ihr OPENAI_API_KEY gültig ist und über Bild-API-Zugriff verfügt.
  • Sie müssen über eine verifizierte OpenAI-Organisation verfügen. Nach der Verifizierung kann es 15–20 Minuten dauern, bis der Bild-API-Zugriff aktiviert wird.
  • Dateipfade müssen absolut sein.
    • Unix/macOS/Linux : Beginnend mit / (zB /path/to/image.png )
    • Windows : Laufwerksbuchstabe gefolgt von : (zB C:/path/to/image.png oder C:\path\to\image.png )
  • Stellen Sie bei der Dateiausgabe sicher, dass das Verzeichnis beschreibbar ist.
  • Wenn Sie Fehler bezüglich der Dateitypen sehen, überprüfen Sie die Dateierweiterungen und -formate Ihrer Bilder.

⚠️ Einschränkungen und Handhabung großer Dateien

  • 1-MB-Nutzlastlimit: MCP-Clients (einschließlich Claude Desktop) haben ein festes 1-MB-Limit für Tool-Antworten. Große Bilder (insbesondere hochauflösende oder mehrere Bilder) können dieses Limit leicht überschreiten, wenn sie als Base64 zurückgegeben werden.
  • Automatische Umstellung auf Dateiausgabe: Wenn die Gesamtbildgröße 1 MB überschreitet, speichert das Tool die Bilder automatisch auf der Festplatte und gibt den/die Dateipfad(e) anstelle von Base64 zurück. Dies gewährleistet die Kompatibilität und verhindert Fehler wie result exceeds maximum length of 1048576 .
  • Standarddateispeicherort: Wenn Sie keinen file_output angeben, werden Bilder unter einem eindeutigen Dateinamen in /tmp (oder dem durch die Umgebungsvariable MCP_HF_WORK_DIR festgelegten Verzeichnis) gespeichert.
  • Umgebungsvariable:
    • MCP_HF_WORK_DIR : Legen Sie dies fest, um zu steuern, wo große Bilder und Dateiausgaben gespeichert werden. Beispiel: export MCP_HF_WORK_DIR=/your/desired/dir
  • Best Practice: Verwenden Sie für große Bilder oder Produktionsbilder immer die Dateiausgabe und stellen Sie sicher, dass Ihr Client für die Verarbeitung von Dateipfaden konfiguriert ist.

📚 Referenzen


🙏 Credits

-
security - not tested
A
license - permissive license
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Ein MCP-Toolserver, der das Generieren und Bearbeiten von Bildern mithilfe der Bildmodelle von OpenAI ermöglicht und die Text-zu-Bild-Generierung sowie erweiterte Bildbearbeitung (Inpainting, Outpainting) über verschiedene MCP-kompatible Clients hinweg unterstützt.

  1. ✨ Funktionen
    1. 🚀 Installation
      1. 🔑 Konfiguration
        1. ⚡ Fortgeschritten
          1. 🧑‍💻 Entwicklung
            1. 📝 Lizenz
              1. 🩺 Fehlerbehebung
                1. ⚠️ Einschränkungen und Handhabung großer Dateien
                  1. 📚 Referenzen
                    1. 🙏 Credits

                      Related MCP Servers

                      • A
                        security
                        A
                        license
                        A
                        quality
                        An MCP Server that integrates with Stability AI's API to provide high-quality image generation, editing, and manipulation capabilities including background removal, outpainting, search-and-replace, and upscaling.
                        Last updated -
                        13
                        35
                        55
                        TypeScript
                        MIT License
                        • Apple
                      • -
                        security
                        F
                        license
                        -
                        quality
                        An MCP server that allows users to generate, edit, and create variations of images through OpenAI's DALL-E API, supporting both DALL-E 2 and DALL-E 3 models.
                        Last updated -
                        2
                        TypeScript
                      • A
                        security
                        F
                        license
                        A
                        quality
                        An MCP (Model Context Protocol) server that allows generating, editing, and creating variations of images using OpenAI's DALL-E APIs.
                        Last updated -
                        1
                        TypeScript
                      • -
                        security
                        A
                        license
                        -
                        quality
                        Provides tools for generating and editing images using OpenAI's gpt-image-1 model via an MCP interface, enabling AI assistants to create and modify images based on text prompts.
                        Last updated -
                        10
                        Python
                        Apache 2.0
                        • Linux
                        • Apple

                      View all related MCP servers

                      MCP directory API

                      We provide all the information about MCP servers via our MCP API.

                      curl -X GET 'https://glama.ai/api/mcp/v1/servers/SureScaleAI/openai-gpt-image-mcp'

                      If you have feedback or need assistance with the MCP directory API, please join our Discord server