Skip to main content
Glama

Vidu MCP Server

by el-el-san

Vidu MCP Server

Vidu動画生成APIと連携するためのModel Context Protocol (MCP) サーバーです。Viduの強力なAIモデルを使用して、画像から動画を生成するツールを提供します。

機能

  • 画像から動画への変換: カスタマイズ可能な設定で静止画から動画を生成
    • 複数モデル対応: viduq1、vidu1.5、vidu2.0
    • モデル固有の時間・解像度制約
    • 4秒動画向けのBGM対応
    • 非同期通知用のコールバックURL対応
  • 生成状況の確認: クレジット使用量情報付きで動画生成タスクの進捗を監視
  • 画像アップロード: Vidu APIで使用する画像を簡単にアップロード(最大10MB)

前提条件

インストール

Smithery経由でのインストール

Smitheryを使用してClaude Desktop用のVidu Video Generation Serverを自動インストール:

npx -y @smithery/cli install @el-el-san/vidu-mcp-server --client claude

Gemini CLI設定

Gemini CLIで使用するには、~/.gemini/settings.jsonにサーバー設定を追加してください:

{ "mcpServers": { "vidu": { "command": "node", "args": [ "your_path/vidu-mcp-server/build/index.js" ], "env": { "VIDU_API_KEY": "your_api_key_here" } } } }

注意: your_pathを実際のインストールディレクトリのパスに、your_api_key_hereをあなたのVidu APIキーに置き換えてください。

手動インストール

  1. このリポジトリをクローン:
git clone https://github.com/el-el-san/vidu-mcp-server.git cd vidu-mcp-server
  1. 依存関係をインストール:
npm install
  1. .env.templateを基に.envファイルを作成し、Vidu APIキーを追加:
VIDU_API_KEY=your_api_key_here

使用方法

Gemini CLI用

  1. TypeScriptコードをビルド:
npm run build
  1. Gemini CLI設定で設定(上記のGemini CLI設定セクションを参照)
  2. Gemini CLIを再起動してMCPを読み込み

ツール

1. 画像から動画への変換

カスタマイズ可能なパラメータで静止画を動画に変換します。

パラメータ:

  • image_url (必須): 動画に変換する画像のURL
  • prompt (オプション): 動画生成用のテキストプロンプト(最大1500文字)
  • duration (オプション): 出力動画の時間(秒)(モデル固有)
    • viduq1: 5秒のみ
    • vidu1.5/vidu2.0: 4秒または8秒(デフォルト4秒)
  • model (オプション): 生成用モデル名("viduq1", "vidu1.5", "vidu2.0", デフォルト "vidu2.0")
  • resolution (オプション): 出力動画の解像度(モデル/時間固有)
    • viduq1 (5s): 1080pのみ
    • vidu1.5/vidu2.0 (4s): "360p", "720p", "1080p"(デフォルト "360p")
    • vidu1.5/vidu2.0 (8s): "720p"のみ
  • movement_amplitude (オプション): フレーム内オブジェクトの動きの振幅("auto", "small", "medium", "large", デフォルト "auto")
  • seed (オプション): 再現性のためのランダムシード
  • bgm (オプション): 動画にBGMを追加(boolean, デフォルト false, 4秒動画のみ)
  • callback_url (オプション): 生成状況変更時の非同期通知用URL

リクエスト例:

{ "image_url": "https://example.com/image.jpg", "prompt": "山を背景にした静かな湖", "duration": 8, "model": "vidu2.0", "resolution": "720p", "movement_amplitude": "medium", "seed": 12345, "bgm": false }

2. 生成状況の確認

実行中の動画生成タスクの状況を確認します。

パラメータ:

  • task_id (必須): 画像から動画への変換ツールで返されたタスクID

リクエスト例:

{ "task_id": "12345abcde" }

3. 画像アップロード

Vidu APIで使用する画像をアップロードします。

パラメータ:

  • image_path (必須): 画像ファイルのローカルパス
  • image_type (必須): 画像ファイルタイプ("png", "webp", "jpeg", "jpg")

リクエスト例:

{ "image_path": "/path/to/your/image.jpg", "image_type": "jpg" }

トラブルシューティング

  • APIキーの問題: Vidu APIキーが.envファイル(手動設定の場合)またはGemini CLI設定(Gemini CLI設定の場合)で正しく設定されていることを確認してください
  • ファイルアップロードエラー: 画像ファイルが有効で、サイズ制限内(upload-imageツールは10MB、直接URL画像は最大50MB)であることを確認してください
  • 接続問題: インターネットアクセスがあり、Vidu APIサーバーに到達できることを確認してください
  • Gemini CLIの問題:
    • Gemini CLIで設定する前にサーバーがビルドされている(npm run build)ことを確認してください
    • settings.jsonのパスが正しいbuild/index.jsファイルを指していることを確認してください
    • 設定変更後にGemini CLIを再起動してください
    • サーバー設定で"disabled": falseに設定してください
Deploy Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

该服务器使用 Vidu 的 AI 模型从静态图像生成视频,具有图像到视频的转换、任务监控和图像上传功能。

  1. 特征
    1. 先决条件
      1. 安装
        1. 通过 Smithery 安装
        2. 手动安装
      2. 用法
        1. 工具
          1. 1. 图像转视频
          2. 2. 检查生成状态
          3. 3.上传图片
        2. 工作原理
          1. 故障排除
            1. 贡献

              Related MCP Servers

              • -
                security
                A
                license
                -
                quality
                A server that provides AI-powered image generation, modification, and processing capabilities through the Model Context Protocol, leveraging Google Gemini models and other image services.
                Last updated -
                13
                MIT License
                • Linux
                • Apple
              • A
                security
                A
                license
                A
                quality
                A TypeScript-based server that converts static images into animated videos with Ghibli-style aesthetics, accessible through Claude Desktop.
                Last updated -
                3
                47
                3
                MIT License
                • Apple
              • -
                security
                A
                license
                -
                quality
                A universal AI server that provides image and video processing tools (background removal, upscaling, vectorization, etc.) for any MCP-compatible client with simple setup.
                Last updated -
                MIT License
                • Apple
                • Linux
              • -
                security
                F
                license
                -
                quality
                This server enables interaction with Google's Video Intelligence API for advanced video analysis, auto-generated using AG2's MCP builder to provide a standardized multi-agent interface.
                Last updated -

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/el-el-san/vidu-mcp-server'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server