openai-gpt-image-mcp
Ein Model Context Protocol (MCP)-Toolserver für die GPT-4o/gpt-image-1-APIs zur Bildgenerierung und -bearbeitung von OpenAI.
Generieren Sie Bilder aus Textaufforderungen mithilfe der neuesten Modelle von OpenAI.
Bearbeiten Sie Bilder (Inpainting, Outpainting, Compositing) mit erweiterter Eingabeaufforderungssteuerung.
Unterstützt : Claude Desktop, Cursor, VSCode, Windsurf und jeden MCP-kompatiblen Client.
✨ Funktionen
create-image : Generieren Sie Bilder aus einer Eingabeaufforderung mit erweiterten Optionen (Größe, Qualität, Hintergrund usw.).
Bild bearbeiten : Bearbeiten oder erweitern Sie Bilder mithilfe einer Eingabeaufforderung und einer optionalen Maske. Dabei werden sowohl Dateipfade als auch Base64-Eingaben unterstützt.
Dateiausgabe : Speichern Sie generierte Bilder direkt auf der Festplatte oder empfangen Sie sie als Base64.
🚀 Installation
🔑 Konfiguration
Zur Claude Desktop- oder VSCode-Konfiguration (einschließlich Cursor/Windsurf) hinzufügen:
⚡ Fortgeschritten
Legen Sie für
create-imageden Wertnfest, um bis zu 10 Bilder gleichzeitig zu generieren.Geben Sie für
edit-imageein Maskenbild (Dateipfad oder Base64) an, um zu steuern, wo Änderungen angewendet werden.Alle Optionen finden Sie unter
src/index.ts.
🧑💻 Entwicklung
TypeScript-Quelle:
src/index.tsAufbau:
yarn buildAusführen:
node dist/index.js
📝 Lizenz
MIT
🩺 Fehlerbehebung
Stellen Sie sicher, dass Ihr
OPENAI_API_KEYgültig ist und über Bild-API-Zugriff verfügt.Sie müssen über eine verifizierte OpenAI-Organisation verfügen. Nach der Verifizierung kann es 15–20 Minuten dauern, bis der Bild-API-Zugriff aktiviert wird.
Dateipfade müssen absolut sein.
Unix/macOS/Linux : Beginnend mit
/(zB/path/to/image.png)Windows : Laufwerksbuchstabe gefolgt von
:(zBC:/path/to/image.pngoderC:\path\to\image.png)
Stellen Sie bei der Dateiausgabe sicher, dass das Verzeichnis beschreibbar ist.
Wenn Sie Fehler bezüglich der Dateitypen sehen, überprüfen Sie die Dateierweiterungen und -formate Ihrer Bilder.
⚠️ Einschränkungen und Handhabung großer Dateien
1-MB-Nutzlastlimit: MCP-Clients (einschließlich Claude Desktop) haben ein festes 1-MB-Limit für Tool-Antworten. Große Bilder (insbesondere hochauflösende oder mehrere Bilder) können dieses Limit leicht überschreiten, wenn sie als Base64 zurückgegeben werden.
Automatische Umstellung auf Dateiausgabe: Wenn die Gesamtbildgröße 1 MB überschreitet, speichert das Tool die Bilder automatisch auf der Festplatte und gibt den/die Dateipfad(e) anstelle von Base64 zurück. Dies gewährleistet die Kompatibilität und verhindert Fehler wie
result exceeds maximum length of 1048576.Standarddateispeicherort: Wenn Sie keinen
file_outputangeben, werden Bilder unter einem eindeutigen Dateinamen in/tmp(oder dem durch die UmgebungsvariableMCP_HF_WORK_DIRfestgelegten Verzeichnis) gespeichert.Umgebungsvariable:
MCP_HF_WORK_DIR: Legen Sie dies fest, um zu steuern, wo große Bilder und Dateiausgaben gespeichert werden. Beispiel:export MCP_HF_WORK_DIR=/your/desired/dir
Best Practice: Verwenden Sie für große Bilder oder Produktionsbilder immer die Dateiausgabe und stellen Sie sicher, dass Ihr Client für die Verarbeitung von Dateipfaden konfiguriert ist.
📚 Referenzen
🙏 Credits
Erstellt mit @modelcontextprotocol/sdk
Verwendet OpenAI Node.js SDK
Erstellt von SureScale.ai
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Ein MCP-Toolserver, der das Generieren und Bearbeiten von Bildern mithilfe der Bildmodelle von OpenAI ermöglicht und die Text-zu-Bild-Generierung sowie erweiterte Bildbearbeitung (Inpainting, Outpainting) über verschiedene MCP-kompatible Clients hinweg unterstützt.
Related MCP Servers
- -security-license-qualityAn OpenAI API-based MCP server that provides deep thinking and analysis capabilities, integrating with AI editor models to deliver comprehensive insights and practical solutions.Last updated -
- -security-license-qualityAn MCP (Model Context Protocol) server that allows generating, editing, and creating variations of images using OpenAI's DALL-E APIs.
- -security-license-qualityProvides tools for generating and editing images using OpenAI's gpt-image-1 model via an MCP interface, enabling AI assistants to create and modify images based on text prompts.Last updated -16Apache 2.0
Recraft AI MCP Serverofficial
Asecurity-licenseAqualityAn MCP server that integrates with Recraft AI to enable generation and manipulation of high-quality raster and vector images through tools like image generation, editing, vectorization, background removal, and upscaling.Last updated -94335MIT License