Vidu MCP 服务器
用于与 Vidu 视频生成 API 交互的模型上下文协议 (MCP) 服务器。该服务器提供使用 Vidu 强大的 AI 模型从图像生成视频的工具。
特征
- 图像到视频的转换:使用可自定义的设置从静态图像生成视频
- 检查生成状态:监控视频生成任务的进度
- 图像上传:轻松上传与 Vidu API 一起使用的图像
先决条件
- Node.js(v14 或更高版本)
- Vidu API 密钥(可从Vidu 网站获取)
- TypeScript(用于开发)
安装
通过 Smithery 安装
要通过Smithery自动为 Claude Desktop 安装 Vidu 视频生成服务器:
手动安装
- 克隆此存储库:
- 安装依赖项:
- 根据
.env.template
创建一个.env
文件并添加您的 Vidu API 密钥:
用法
- 构建 TypeScript 代码:
- 启动服务器:
MCP 服务器将启动并准备接受来自 MCP 客户端的连接。
工具
1. 图像转视频
使用可自定义的参数将静态图像转换为视频。
参数:
image_url
(必填):要转换为视频的图像的 URLprompt
(可选):视频生成的文本提示(最多 1500 个字符)duration
(可选):输出视频的持续时间(以秒为单位)(4 或 8,默认 4)model
(可选):生成的模型名称(“vidu1.0”,“vidu1.5”,“vidu2.0”,默认“vidu2.0”)resolution
(可选):输出视频的分辨率(“360p”,“720p”,“1080p”,默认“720p”)movement_amplitude
(可选):物体在框架内的运动幅度(“自动”、“小”、“中”、“大”,默认“自动”)seed
(可选):用于重复性的随机种子
示例请求:
2. 检查生成状态
检查正在运行的视频生成任务的状态。
参数:
task_id
(必填):图片转视频工具返回的任务ID
示例请求:
3.上传图片
上传图像以供 Vidu API 使用。
参数:
image_path
(必需):图像文件的本地路径image_type
(必需):图像文件类型(“png”,“webp”,“jpeg”,“jpg”)
示例请求:
工作原理
该服务器使用模型上下文协议 (MCP) 为 AI 工具提供标准化接口。启动服务器时,它会通过标准输入/输出通道监听命令,并以结构化格式返回结果。
服务器处理与 Vidu API 交互的所有复杂问题,包括:
- 使用 API 密钥进行身份验证
- 文件上传和格式验证
- 异步任务管理和轮询
- 错误处理和报告
故障排除
- API 密钥问题:确保您的 Vidu API 密钥在
.env
文件中正确设置 - 文件上传错误:检查您的图像文件是否有效且大小不超过 10MB
- 连接问题:确保您可以访问互联网并可以访问 Vidu API 服务器
贡献
欢迎贡献代码!欢迎提交 Pull 请求。
You must be authenticated.
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
该服务器使用 Vidu 的 AI 模型从静态图像生成视频,具有图像到视频的转换、任务监控和图像上传功能。
Related MCP Servers
- -securityFlicense-qualityA server that provides Luma AI's video generation API as the Model Context Protocol (MCP)Last updated -2TypeScript
- AsecurityAlicenseAqualityAn MCP Server that integrates with Stability AI's API to provide high-quality image generation, editing, and manipulation capabilities including background removal, outpainting, search-and-replace, and upscaling.Last updated -133555TypeScriptMIT License
- -securityAlicense-qualityA server that helps AI models better understand Vite/Nuxt applications, providing enhanced context awareness for development support.Last updated -637TypeScriptMIT License
- -securityAlicense-qualityA server that provides AI-powered image generation, modification, and processing capabilities through the Model Context Protocol, leveraging Google Gemini models and other image services.Last updated -6PythonMIT License