OpenAI 画像生成 MCP サーバー
このプロジェクトは、公式 Python SDK を介して OpenAI のgpt-image-1
モデルを使用して画像を生成および編集するためのツールを提供する MCP (Model Context Protocol) サーバーを実装します。
特徴
この MCP サーバーは次のツールを提供します。
generate_image
: テキストプロンプトに基づいて OpenAI のgpt-image-1
モデルを使用して画像を生成し、保存します。- 入力スキーマ:
- 出力:
{"status": "success", "saved_path": "path/to/image.png"}
またはエラー辞書。
- 入力スキーマ:
edit_image
: OpenAIのgpt-image-1
モデルを使用して画像を編集またはバリエーションを作成し、保存します。複数の入力画像を参照として使用したり、マスクを使用してインペインティングを実行したりできます。- 入力スキーマ:
- 出力:
{"status": "success", "saved_path": "path/to/image.png"}
またはエラー辞書。
- 入力スキーマ:
前提条件
- Python(3.8以降を推奨)
- pip (Python パッケージインストーラー)
- OpenAI API キー (スクリプト内で直接設定するか、
OPENAI_API_KEY
環境変数を介して設定します。セキュリティ上、環境変数の使用を強くお勧めします)。 - MCP サーバーを管理および起動できる MCP クライアント環境 (Cline で使用されるものなど)。
インストール
- リポジトリをクローンします。
- 仮想環境をセットアップする (推奨):
- 依存関係をインストールします:
- **(オプションですが推奨)環境変数の設定:**スクリプト内でハードコードするのではなく、
OPENAI_API_KEY
環境変数にOpenAIキーを設定します。設定方法はオペレーティングシステムによって異なります。
構成(Cline MCP クライアント用)
このサーバーを AI アシスタント (Cline など) で使用できるようにするには、その構成を MCP 設定ファイル (例: cline_mcp_settings.json
) に追加します。
設定ファイルでmcpServers
オブジェクトを見つけて、次のエントリを追加します。
重要: C:/path/to/your/cloned/repo/
このリポジトリをクローンしたマシンへの正しい絶対パスに置き換えてください。パス区切り文字がオペレーティングシステムに合っていることを確認してください(例:Windowsではバックスラッシュ\
を使用)。APIキーを環境変数で設定している場合は、スクリプトから削除し、MCPクライアントがサポートしている場合は、 env
セクションに追加することができます。
サーバーの実行
通常、サーバーを手動で起動する必要はありません。MCPクライアント(Clineなど)は、ツールのいずれかが初めて呼び出されたときに、設定ファイルに指定されたcommand
とargs
を使用してサーバーを自動的に起動します。
手動でテストする場合(依存関係がインストールされ、API キーが使用可能であることを確認してください):
使用法
AIアシスタントは、 generate_image
ツールとedit_image
ツールを使用してサーバーとやり取りします。画像は、 openai_image_mcp.py
スクリプトが配置されている場所に作成されたai-images
サブディレクトリに保存されます。ツールは成功すると、保存された画像への絶対パスを返します。
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
MCP インターフェースを介して OpenAI の gpt-image-1 モデルを使用して画像を生成および編集するためのツールを提供し、AI アシスタントがテキスト プロンプトに基づいて画像を作成および変更できるようにします。
Related MCP Servers
- AsecurityAlicenseAqualityAllows AI assistants to generate and transform high-quality images from text prompts using Google's Gemini model via the MCP protocol.Last updated -316PythonMIT License
- -securityAlicense-qualityAn MCP tool server that enables generating and editing images through OpenAI's image models, supporting text-to-image generation and advanced image editing (inpainting, outpainting) across various MCP-compatible clients.Last updated -60TypeScriptMIT License
- AsecurityFlicenseAqualityAn MCP (Model Context Protocol) server that allows generating, editing, and creating variations of images using OpenAI's DALL-E APIs.Last updated -1TypeScript
- AsecurityAlicenseAqualityAn MCP server that allows Claude to use OpenAI's image generation capabilities (gpt-image-1) to create image assets for users, which is particularly useful for game and web development projects.Last updated -112JavaScriptMIT License