Provides tools for generating and editing images using OpenAI's GPT-4o/gpt-image-1 APIs, supporting text-to-image generation, image editing operations (inpainting, outpainting, compositing), and advanced prompt control.
openai-gpt-image-mcp
Ein Model Context Protocol (MCP)-Toolserver für die GPT-4o/gpt-image-1-APIs zur Bildgenerierung und -bearbeitung von OpenAI.
- Generieren Sie Bilder aus Textaufforderungen mithilfe der neuesten Modelle von OpenAI.
- Bearbeiten Sie Bilder (Inpainting, Outpainting, Compositing) mit erweiterter Eingabeaufforderungssteuerung.
- Unterstützt : Claude Desktop, Cursor, VSCode, Windsurf und jeden MCP-kompatiblen Client.
✨ Funktionen
- create-image : Generieren Sie Bilder aus einer Eingabeaufforderung mit erweiterten Optionen (Größe, Qualität, Hintergrund usw.).
- Bild bearbeiten : Bearbeiten oder erweitern Sie Bilder mithilfe einer Eingabeaufforderung und einer optionalen Maske. Dabei werden sowohl Dateipfade als auch Base64-Eingaben unterstützt.
- Dateiausgabe : Speichern Sie generierte Bilder direkt auf der Festplatte oder empfangen Sie sie als Base64.
🚀 Installation
🔑 Konfiguration
Zur Claude Desktop- oder VSCode-Konfiguration (einschließlich Cursor/Windsurf) hinzufügen:
⚡ Fortgeschritten
- Legen Sie für
create-image
den Wertn
fest, um bis zu 10 Bilder gleichzeitig zu generieren. - Geben Sie für
edit-image
ein Maskenbild (Dateipfad oder Base64) an, um zu steuern, wo Änderungen angewendet werden. - Alle Optionen finden Sie unter
src/index.ts
.
🧑💻 Entwicklung
- TypeScript-Quelle:
src/index.ts
- Aufbau:
yarn build
- Ausführen:
node dist/index.js
📝 Lizenz
MIT
🩺 Fehlerbehebung
- Stellen Sie sicher, dass Ihr
OPENAI_API_KEY
gültig ist und über Bild-API-Zugriff verfügt. - Sie müssen über eine verifizierte OpenAI-Organisation verfügen. Nach der Verifizierung kann es 15–20 Minuten dauern, bis der Bild-API-Zugriff aktiviert wird.
- Dateipfade müssen absolut sein.
- Unix/macOS/Linux : Beginnend mit
/
(zB/path/to/image.png
) - Windows : Laufwerksbuchstabe gefolgt von
:
(zBC:/path/to/image.png
oderC:\path\to\image.png
)
- Unix/macOS/Linux : Beginnend mit
- Stellen Sie bei der Dateiausgabe sicher, dass das Verzeichnis beschreibbar ist.
- Wenn Sie Fehler bezüglich der Dateitypen sehen, überprüfen Sie die Dateierweiterungen und -formate Ihrer Bilder.
⚠️ Einschränkungen und Handhabung großer Dateien
- 1-MB-Nutzlastlimit: MCP-Clients (einschließlich Claude Desktop) haben ein festes 1-MB-Limit für Tool-Antworten. Große Bilder (insbesondere hochauflösende oder mehrere Bilder) können dieses Limit leicht überschreiten, wenn sie als Base64 zurückgegeben werden.
- Automatische Umstellung auf Dateiausgabe: Wenn die Gesamtbildgröße 1 MB überschreitet, speichert das Tool die Bilder automatisch auf der Festplatte und gibt den/die Dateipfad(e) anstelle von Base64 zurück. Dies gewährleistet die Kompatibilität und verhindert Fehler wie
result exceeds maximum length of 1048576
. - Standarddateispeicherort: Wenn Sie keinen
file_output
angeben, werden Bilder unter einem eindeutigen Dateinamen in/tmp
(oder dem durch die UmgebungsvariableMCP_HF_WORK_DIR
festgelegten Verzeichnis) gespeichert. - Umgebungsvariable:
MCP_HF_WORK_DIR
: Legen Sie dies fest, um zu steuern, wo große Bilder und Dateiausgaben gespeichert werden. Beispiel:export MCP_HF_WORK_DIR=/your/desired/dir
- Best Practice: Verwenden Sie für große Bilder oder Produktionsbilder immer die Dateiausgabe und stellen Sie sicher, dass Ihr Client für die Verarbeitung von Dateipfaden konfiguriert ist.
📚 Referenzen
🙏 Credits
- Erstellt mit @modelcontextprotocol/sdk
- Verwendet OpenAI Node.js SDK
- Erstellt von SureScale.ai
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Ein MCP-Toolserver, der das Generieren und Bearbeiten von Bildern mithilfe der Bildmodelle von OpenAI ermöglicht und die Text-zu-Bild-Generierung sowie erweiterte Bildbearbeitung (Inpainting, Outpainting) über verschiedene MCP-kompatible Clients hinweg unterstützt.
Related MCP Servers
- AsecurityAlicenseAqualityAn MCP Server that integrates with Stability AI's API to provide high-quality image generation, editing, and manipulation capabilities including background removal, outpainting, search-and-replace, and upscaling.Last updated -133555TypeScriptMIT License
- -securityFlicense-qualityAn MCP server that allows users to generate, edit, and create variations of images through OpenAI's DALL-E API, supporting both DALL-E 2 and DALL-E 3 models.Last updated -2TypeScript
- AsecurityFlicenseAqualityAn MCP (Model Context Protocol) server that allows generating, editing, and creating variations of images using OpenAI's DALL-E APIs.Last updated -1TypeScript
- -securityAlicense-qualityProvides tools for generating and editing images using OpenAI's gpt-image-1 model via an MCP interface, enabling AI assistants to create and modify images based on text prompts.Last updated -10PythonApache 2.0