Click on "Install Server".
Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state.
In the chat, type
@followed by the MCP server name and your instructions, e.g., "@jimeng4-mcpgenerate a 4K cinematic image of a cyberpunk city in the rain"
That's it! The server will respond to your query, and you can continue using it as needed.
Here is a step-by-step guide with screenshots.
即梦AI多模态MCP (jimeng4-mcp)
这是一个基于火山引擎即梦AI的多模态生成服务,完整支持即梦4.0、图生图3.0、文生图3.1/3.0等所有最新模型,可通过MCP协议在Cursor、Claude Desktop等MCP客户端中使用,也可作为独立库调用。支持 macOS、Linux、Windows 及 WSL 环境。
作者: bachstudio
包名: jimeng4-mcp
版本更新
v1.0.0 (首次发布)
重大更新: 完整支持即梦AI官方文档中的所有最新模型
新增即梦4.0图片生成工具 (jimeng-v40-generate) - 支持文生图、图像编辑及多图组合生成,最多10张输入图,最多15张输出图,支持4K超高清输出
新增即梦图生图3.0智能参考工具 (jimeng-i2i-v30) - 支持基于文本指令进行图像编辑
新增即梦文生图3.1工具 (jimeng-t2i-v31) - 画面效果呈现升级版,在美感、风格和细节方面显著提升
新增即梦文生图3.0工具 (jimeng-t2i-v30) - 文字响应准确度提升版,支持各类艺术字体
所有新工具均采用异步任务模式,自动处理任务提交和结果轮询
v1.0.14
增强MCP工具定义,确保所有工具在客户端可见
优化异步参数处理,默认启用异步模式避免超时
增加更详细的视频生成调试信息
v1.0.9-beta.1
测试版:增强MCP工具定义,确保所有工具在客户端可见
优化异步参数处理,默认启用异步模式避免超时
增加更详细的视频生成调试信息
修复工具参数传递问题
v1.0.5
优化文档结构,为不同平台提供清晰配置说明
增加 PowerShell 配置示例
提供各平台永久环境变量设置方法
添加多平台配置注意事项
v1.0.4
优化服务启动和响应返回,现在所有响应均使用标准JSON格式
统一错误处理和成功响应的数据结构
增强错误信息的可读性和可解析性
核心功能
图像生成系列
✅ 即梦4.0图片生成 (jimeng-v40-generate) - 支持文生图、图像编辑及多图组合生成(最多10张输入图,最多15张输出图),支持4K超高清输出
✅ 即梦图生图3.0 (jimeng-i2i-v30) - 基于文本指令的智能图像编辑(添加/删除实体、修改风格/色彩/动作/背景等)
✅ 即梦文生图3.1 (jimeng-t2i-v31) - 画面效果呈现升级版,在美感、风格精准多样及细节丰富度方面显著提升
✅ 即梦文生图3.0 (jimeng-t2i-v30) - 文字响应准确度提升版,支持图文排版和各类艺术字体
视频生成系列
✅ 文生视频 - 将文本描述转换为流畅视频 (模型: jimeng_vgfm_t2v_l20)
✅ 图生视频 - 将静态图像转换为动态视频 (模型: jimeng_vgfm_i2v_l20)
技术特性
✅ 多平台支持 - 支持 macOS、Linux、Windows 及 WSL 环境
🛠️ 完整TypeScript类型定义和错误处理
🔄 支持异步任务处理和状态追踪
🎛️ 自定义参数控制 (尺寸、比例、风格、种子等)
系统架构
以下流程图展示了即梦AI多模态MCP的工作流程和系统架构:
可用MCP工具
即梦AI新版图像生成工具(推荐使用)
工具名称 | 描述 | 主要参数 | 特点 |
| 即梦4.0图片生成 | prompt, image_urls, width, height, size, scale | 支持文生图、图编辑、多图组合,最多10张输入/15张输出,4K超高清 |
| 即梦图生图3.0 | image_url, prompt, width, height, scale | 智能图像编辑,支持各种编辑操作 |
| 即梦文生图3.1 | prompt, use_pre_llm, width, height | 画面效果升级版,美感和细节显著提升 |
| 即梦文生图3.0 | prompt, use_pre_llm, width, height | 文字响应准确版,支持艺术字体 |
视频生成工具
工具名称 | 描述 | 主要参数 |
| 生成视频 | prompt, async, intent_sync |
| 提交视频生成任务 | prompt |
| 获取视频任务结果 | task_id |
传统工具(向后兼容)
工具名称 | 描述 | 主要参数 |
| 旧版图像生成 | text, illustration, color, ratio |
快速开始
安装
所有平台(macOS/Linux/Windows):
环境变量配置
在使用前,需设置火山引擎即梦AI服务的访问密钥:
macOS/Linux
WSL (Windows Subsystem for Linux)
Windows
命令提示符 (CMD):
PowerShell:
发布与版本管理
项目包含一个 publish.sh 脚本,用于简化版本发布和管理的流程。
使用方法
在项目根目录下运行脚本:
脚本会提供一个菜单,引导你完成不同操作。
功能选项
发布新版本 (选项 1-5):
patch: 用于修复错误 (例如
1.0.4->1.0.5)。minor: 用于添加向后兼容的功能 (例如
1.0.4->1.1.0)。major: 用于不向后兼容的重大更改 (例如
1.0.4->2.0.0)。beta: 创建或递增一个测试版本 (例如
1.0.4->1.0.5-beta.0或1.0.5-beta.0->1.0.5-beta.1)。自定义版本: 手动输入一个新版本号。
选择这些选项后,脚本会自动:
检查未提交的 Git 更改。
更新
package.json、mcp.json、examples/mcp-server.ts和README.md中的版本号。构建项目。
发布到 npm(beta 版本会使用
beta标签)。提交版本更新并创建 Git 标签。
取消发布版本 (选项 6):
这是一个危险操作,请谨慎使用。
脚本会要求你输入需要取消发布的版本号,支持输入多个版本号(用空格隔开)。
在执行
npm unpublish前,会要求二次确认。注意: npm 策略通常只允许在发布后的72小时内取消发布。
MCP客户端配置
Cursor配置
macOS/Linux
在Cursor配置目录中创建mcp-config.json文件:
Windows
在Cursor配置目录中创建mcp-config.json文件:
WSL (Windows Subsystem for Linux)
在Cursor配置目录中创建mcp-config.json文件:
注意:WSL环境下需要使用
cmd /c前缀来确保命令正确执行。
Claude Desktop配置
macOS/Linux
在Claude Desktop的配置文件claude_desktop_config.json中添加:
Windows
在Claude Desktop的配置文件claude_desktop_config.json中添加:
WSL (Windows Subsystem for Linux)
在Claude Desktop的配置文件claude_desktop_config.json中添加:
配置注意事项
macOS/Linux: 确保使用正确的环境变量和路径。
Windows:
如果遇到路径问题,请检查命令路径是否正确,必要时使用完整路径。
如果使用全局安装,可将
npx -y jimeng-ai-mcp改为jimeng-ai-mcp命令。
WSL (Windows Subsystem for Linux):
在 WSL 环境中,必须使用
cmd /c前缀来确保命令正确执行。请确保 Windows 端已正确安装 Node.js 和 npm。
工具使用示例
在支持 MCP 的客户端(如 Cursor、Claude Desktop)中,可以使用以下方式调用即梦AI工具:
即梦4.0图片生成示例
文生图(基础使用)
文生图(指定尺寸)
图编辑(基于输入图)
即梦图生图3.0示例
即梦文生图3.1示例
即梦文生图3.0示例
生成视频示例
异步视频任务示例
常见问题与故障排除
1. 无法通过 npx 安装或运行
如果遇到 npx jimeng4-mcp 无法找到包的问题,请尝试:
确认网络连接正常,能够访问 npm 仓库
使用
npm install -g jimeng4-mcp先全局安装,再使用jimeng4-mcp命令检查 Node.js 版本是否满足要求 (需要 v14.0.0 或更高版本)
2. 环境变量问题
确保已正确设置
JIMENG_ACCESS_KEY和JIMENG_SECRET_KEY环境变量在 MCP 客户端配置文件中也需要配置这些环境变量
可以通过创建 .env 文件设置环境变量(项目提供了 .env.example 作为参考,确保文件位于工作目录)
3. 多平台兼容性
Windows 用户可能需要调整路径分隔符(使用
\\或/)WSL 用户需要使用
cmd /c前缀确保 npm 包已正确安装在当前系统环境中
贡献与开发
欢迎为项目贡献代码或提出改进建议!以下是开发流程:
Fork 项目仓库
创建功能分支 (
git checkout -b feature/amazing-feature)提交更改 (
git commit -m 'Add some amazing feature')推送到分支 (
git push origin feature/amazing-feature)创建 Pull Request
开发环境设置
MCP工具使用
generate-image
生成图像的工具,根据文字提示生成图像。
参数:
text: 要在图片上显示的文字illustration: 作为图片配饰的插画元素关键词color: 图片的背景主色调ratio: 图片比例,支持: 4:3 (512×384), 3:4 (384×512), 16:9 (512×288), 9:16 (288×512)
示例:
generate-video
生成视频的工具,使用即梦AI文生视频模型。
参数:
prompt: 视频内容的描述num_frames: 视频帧数 (可选,默认16)fps: 视频帧率 (可选,默认8)
示例:
generate-image-to-video
图生视频工具,将静态图片转换为动态视频。
参数:
image_urls: 输入图片URL数组 (JPEG/PNG格式)prompt: 动画效果描述 (可选)aspect_ratio: 视频比例 (可选,如"16:9"、"4:3"等,默认"16:9")num_frames: 视频帧数 (可选,默认16)fps: 视频帧率 (可选,默认8)
示例:
作为客户端库使用
基本用法
高级用法:异步任务处理
对于耗时较长的视频生成任务,可以使用异步方式:
Docker部署
创建以下Dockerfile:
构建并运行:
开发指南
本地开发
发布NPM包
故障排除
常见问题
认证失败:检查JIMENG_ACCESS_KEY和JIMENG_SECRET_KEY是否正确。
图像格式不支持:确保使用JPEG/PNG格式的图片,且URL可公开访问。
QPS限制:API有QPS=1的限制,多次调用时需间隔60秒。
内容安全检查:确保生成内容符合平台内容政策。
错误码列表
ERR_AUTH_FAILED: 认证失败,检查访问密钥ERR_TASK_FAILED: 任务失败,查看详细错误信息ERR_INVALID_PARAM: 参数无效,检查输入参数ERR_NETWORK: 网络错误,检查网络连接ERR_SERVER: 服务器错误,稍后重试
贡献与支持
欢迎提交问题和拉取请求!如有问题,请通过GitHub Issues反馈。
许可证
MIT
功能详解
图像生成 (generate-image)
使用generate-image工具可以根据文字描述、插图元素和颜色生成图像:
支持的图片比例:
4:3- 512×384像素3:4- 384×512像素16:9- 512×288像素9:16- 288×512像素
视频生成 (generate-video)
generate-video工具支持根据文字描述生成视频。从v1.0.5版本开始,该工具默认采用异步方式,即立即返回任务ID,然后需要使用get-video-task工具查询结果。
参数说明
prompt- 视频内容描述(必填)async- 是否使用异步方式(可选,默认为true)intent_sync- 是否检测到同步生成意图(可选,默认为false)
行为模式
异步模式(默认):
立即返回任务ID,不等待视频生成完成
需要后续使用
get-video-task工具查询结果适合生产环境和避免超时的场景
{ "prompt": "一只熊猫在竹林中玩耍" }同步模式:
等待视频生成完成后返回结果(可能需要1-2分钟)
有可能因为生成时间过长导致请求超时
适合测试和快速体验
触发同步模式的方式:
显式设置
async=false设置
intent_sync=true在提示中包含表示期望即时结果的关键词(如"一次输出"、"同步输出"、"等待结果"等)
{ "prompt": "一只熊猫在竹林中玩耍", "async": false }或通过意图表达(大模型会自动识别并设置
intent_sync=true):请帮我生成一个熊猫在竹林中玩耍的视频,希望一次输出结果
最佳实践
对于生产环境或AI助手集成,建议使用默认的异步模式
视频生成通常需要1-2分钟,异步模式可避免超时错误
如果需要同步结果,确保设置足够长的请求超时时间
分步式视频生成
对于需要更精细控制的场景,可以使用分步式视频生成:
提交视频生成任务:
使用返回的任务ID查询结果: