openai-gpt-image-mcp
OpenAI の GPT-4o/gpt-image-1 画像生成および編集 API 用のモデル コンテキスト プロトコル (MCP) ツール サーバー。
- OpenAI の最新モデルを使用して、テキスト プロンプトから画像を生成します。
- 高度なプロンプト コントロールを使用して画像を編集します(インペインティング、アウトペインティング、合成)。
- サポート対象: Claude Desktop、Cursor、VSCode、Windsurf、および MCP 互換クライアント。
✨ 特徴
- create-image : プロンプトから、詳細オプション (サイズ、品質、背景など) を使用して画像を生成します。
- edit-image : プロンプトとオプションのマスクを使用して画像を編集または拡張します。ファイル パスと base64 入力の両方をサポートします。
- ファイル出力: 生成された画像を直接ディスクに保存するか、base64 として受け取ります。
🚀 インストール
git clone https://github.com/SureScaleAI/openai-gpt-image-mcp.git
cd openai-gpt-image-mcp
yarn install
yarn build
🔑 構成
Claude Desktop または VSCode (Cursor/Windsurf を含む) の設定に追加します。
{
"mcpServers": {
"openai-gpt-image-mcp": {
"command": "node",
"args": ["/absolute/path/to/dist/index.js"],
"env": { "OPENAI_API_KEY": "sk-..." }
}
}
}
⚡ 上級
create-image
の場合、 n
を設定すると、一度に最大 10 枚の画像が生成されます。edit-image
には、編集を適用する場所を制御するためのマスク イメージ (ファイル パスまたは base64) を指定します。- すべてのオプションについては、
src/index.ts
参照してください。
🧑💻 開発
- TypeScript ソース:
src/index.ts
- ビルド:
yarn build
- 実行:
node dist/index.js
📝 ライセンス
マサチューセッツ工科大学
🩺 トラブルシューティング
OPENAI_API_KEY
が有効であり、イメージ API にアクセスできることを確認してください。- 認証済みのOpenAI組織が必要です。認証後、画像APIアクセスが有効になるまで15~20分かかる場合があります。
- ファイル パスは絶対パスである必要があります。
- ファイル出力の場合、ディレクトリが書き込み可能であることを確認してください。
- ファイルの種類に関するエラーが表示される場合は、画像ファイルの拡張子と形式を確認してください。
⚠️ 制限事項と大きなファイルの処理
- 1MBのペイロード制限: MCPクライアント(Claude Desktopを含む)では、ツールレスポンスに1MBの厳格な制限があります。大きな画像(特に高解像度画像や複数の画像)をbase64で返すと、この制限を簡単に超えてしまう可能性があります。
- **ファイル出力への自動切り替え:**画像サイズの合計が1MBを超える場合、ツールは自動的に画像をディスクに保存し、base64ではなくファイルパスを返します。これにより互換性が確保され、
result exceeds maximum length of 1048576
といったエラーを回避できます。 - デフォルトのファイルの場所:
file_output
パスを指定しない場合、画像は一意のファイル名で/tmp
(またはMCP_HF_WORK_DIR
環境変数で設定されたディレクトリ) に保存されます。 - 環境変数:
MCP_HF_WORK_DIR
: 大きな画像やファイル出力の保存場所を制御するには、これを設定します。例: export MCP_HF_WORK_DIR=/your/desired/dir
- **ベスト プラクティス:**大きな画像や実稼働画像の場合は、常にファイル出力を使用し、クライアントがファイル パスを処理できるように構成されていることを確認します。
📚 参考文献
🙏 クレジット