使用 Veo2 生成 MCP 视频
该项目实现了一个模型上下文协议 (MCP) 服务器,该服务器公开了 Google 的 Veo2 视频生成功能。它允许客户端根据文本提示或图像生成视频,并通过 MCP 资源访问生成的视频。
特征
- 根据文本提示生成视频
- 从图像生成视频
- 通过 MCP 资源访问生成的视频
- 视频生成模板示例
- 支持 stdio 和 SSE 传输
示例图像
图像转视频示例
先决条件
- Node.js 18 或更高版本
- 可访问 Gemini API 和 Veo2 模型的 Google API 密钥(= 您需要使用 API 密钥设置信用卡!-> 转到 aistudio.google.com)
安装
在FLUJO中安装
- 单击“添加服务器”
- 将 Github URL 复制并粘贴到 FLUJO 中
- 单击解析、克隆、安装、构建和保存。
通过 Smithery 安装
要通过Smithery自动为 Claude Desktop 安装 mcp-video-generation-veo2:
手动安装
- 克隆存储库:
- 安装依赖项:
- 使用您的 Google API 密钥创建一个
.env
文件:.env
文件支持以下变量:GOOGLE_API_KEY
:您的 Google API 密钥(必需)PORT
:服务器端口(默认值:3000)STORAGE_DIR
:存储生成视频的目录(默认值:./generated-videos)LOG_LEVEL
:日志记录级别(默认值:致命)- 可用级别:详细、调试、信息、警告、错误、致命、无
- 对于开发,设置为
debug
或info
以获取更详细的日志 - 对于生产环境,保持为
fatal
以最小化控制台输出
- 构建项目:
用法
启动服务器
您可以使用 stdio 或 SSE 传输启动服务器:
stdio 传输(默认)
上交所运输
这将在端口 3000(或.env
文件中指定的端口)上启动服务器。
MCP 工具
该服务器公开以下 MCP 工具:
生成视频文本
根据文本提示生成视频。
参数:
prompt
(字符串):视频生成的文本提示config
(对象,可选):配置选项aspectRatio
(字符串,可选):“16:9”或“9:16”personGeneration
(字符串,可选):“dont_allow”或“allow_adult”numberOfVideos
(数字,可选):1 或 2durationSeconds
(数字,可选):5 到 8 之间enhancePrompt
(boolean,可选):是否增强提示negativePrompt
(字符串,可选):描述不生成内容的文本
例子:
从图像生成视频
从图像生成视频。
参数:
image
(字符串):Base64 编码的图像数据prompt
(字符串,可选):指导视频生成的文本提示config
(对象,可选):配置选项(与上面相同,但 personGeneration 仅支持“dont_allow”)
列出生成的视频
列出所有生成的视频。
MCP 资源
服务器公开以下 MCP 资源:
视频://{id}
通过 ID 访问生成的视频。
视频://模板
访问示例视频生成模板。
发展
项目结构
src/
:源代码index.ts
:主入口点server.ts
:MCP 服务器配置config.ts
:配置处理tools/
:MCP 工具实现resources/
:MCP 资源实现services/
:外部服务集成utils/
:实用函数
建筑
开发模式
执照
麻省理工学院
You must be authenticated.
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
MCP 服务器公开了 Google 的 Veo2 视频生成功能,允许客户端从文本提示或图像生成视频。
Related Resources
Related MCP Servers
- -securityFlicense-qualityAn MCP server that enables LLMs to search YouTube, retrieve video information, and access video transcripts through standardized tools.Last updated -TypeScript
- -security-license-qualityA TypeScript-based MCP server that lets users generate images using OpenAI's dall-e-3 model by providing a prompt and image name.Last updated -1
- -securityAlicense-qualityA MCP server that creates graphic recordings by converting websites or text input into visual summaries using different prompt styles (standard, elementary, timeline).Last updated -TypeScriptMIT License
- AsecurityFlicenseAqualityAn MCP server that generates images based on text prompts using Black Forest Lab's FLUX model, allowing for customized image dimensions, prompt upsampling, safety settings, and batch generation.Last updated -3TypeScript