Skip to main content
Glama

Vidu MCP Server

by el-el-san

Vidu MCP Server

Vidu動画生成APIと連携するためのModel Context Protocol (MCP) サーバーです。Viduの強力なAIモデルを使用して、画像から動画を生成するツールを提供します。

機能

  • 画像から動画への変換: カスタマイズ可能な設定で静止画から動画を生成
    • 複数モデル対応: viduq1、vidu1.5、vidu2.0
    • モデル固有の時間・解像度制約
    • 4秒動画向けのBGM対応
    • 非同期通知用のコールバックURL対応
  • 生成状況の確認: クレジット使用量情報付きで動画生成タスクの進捗を監視
  • 画像アップロード: Vidu APIで使用する画像を簡単にアップロード(最大10MB)

前提条件

インストール

Smithery経由でのインストール

Smitheryを使用してClaude Desktop用のVidu Video Generation Serverを自動インストール:

npx -y @smithery/cli install @el-el-san/vidu-mcp-server --client claude

Gemini CLI設定

Gemini CLIで使用するには、~/.gemini/settings.jsonにサーバー設定を追加してください:

{ "mcpServers": { "vidu": { "command": "node", "args": [ "your_path/vidu-mcp-server/build/index.js" ], "env": { "VIDU_API_KEY": "your_api_key_here" } } } }

注意: your_pathを実際のインストールディレクトリのパスに、your_api_key_hereをあなたのVidu APIキーに置き換えてください。

手動インストール

  1. このリポジトリをクローン:
git clone https://github.com/el-el-san/vidu-mcp-server.git cd vidu-mcp-server
  1. 依存関係をインストール:
npm install
  1. .env.templateを基に.envファイルを作成し、Vidu APIキーを追加:
VIDU_API_KEY=your_api_key_here

使用方法

Gemini CLI用

  1. TypeScriptコードをビルド:
npm run build
  1. Gemini CLI設定で設定(上記のGemini CLI設定セクションを参照)
  2. Gemini CLIを再起動してMCPを読み込み

ツール

1. 画像から動画への変換

カスタマイズ可能なパラメータで静止画を動画に変換します。

パラメータ:

  • image_url (必須): 動画に変換する画像のURL
  • prompt (オプション): 動画生成用のテキストプロンプト(最大1500文字)
  • duration (オプション): 出力動画の時間(秒)(モデル固有)
    • viduq1: 5秒のみ
    • vidu1.5/vidu2.0: 4秒または8秒(デフォルト4秒)
  • model (オプション): 生成用モデル名("viduq1", "vidu1.5", "vidu2.0", デフォルト "vidu2.0")
  • resolution (オプション): 出力動画の解像度(モデル/時間固有)
    • viduq1 (5s): 1080pのみ
    • vidu1.5/vidu2.0 (4s): "360p", "720p", "1080p"(デフォルト "360p")
    • vidu1.5/vidu2.0 (8s): "720p"のみ
  • movement_amplitude (オプション): フレーム内オブジェクトの動きの振幅("auto", "small", "medium", "large", デフォルト "auto")
  • seed (オプション): 再現性のためのランダムシード
  • bgm (オプション): 動画にBGMを追加(boolean, デフォルト false, 4秒動画のみ)
  • callback_url (オプション): 生成状況変更時の非同期通知用URL

リクエスト例:

{ "image_url": "https://example.com/image.jpg", "prompt": "山を背景にした静かな湖", "duration": 8, "model": "vidu2.0", "resolution": "720p", "movement_amplitude": "medium", "seed": 12345, "bgm": false }

2. 生成状況の確認

実行中の動画生成タスクの状況を確認します。

パラメータ:

  • task_id (必須): 画像から動画への変換ツールで返されたタスクID

リクエスト例:

{ "task_id": "12345abcde" }

3. 画像アップロード

Vidu APIで使用する画像をアップロードします。

パラメータ:

  • image_path (必須): 画像ファイルのローカルパス
  • image_type (必須): 画像ファイルタイプ("png", "webp", "jpeg", "jpg")

リクエスト例:

{ "image_path": "/path/to/your/image.jpg", "image_type": "jpg" }

トラブルシューティング

  • APIキーの問題: Vidu APIキーが.envファイル(手動設定の場合)またはGemini CLI設定(Gemini CLI設定の場合)で正しく設定されていることを確認してください
  • ファイルアップロードエラー: 画像ファイルが有効で、サイズ制限内(upload-imageツールは10MB、直接URL画像は最大50MB)であることを確認してください
  • 接続問題: インターネットアクセスがあり、Vidu APIサーバーに到達できることを確認してください
  • Gemini CLIの問題:
    • Gemini CLIで設定する前にサーバーがビルドされている(npm run build)ことを確認してください
    • settings.jsonのパスが正しいbuild/index.jsファイルを指していることを確認してください
    • 設定変更後にGemini CLIを再起動してください
    • サーバー設定で"disabled": falseに設定してください
Deploy Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

A server that enables generating videos from static images using Vidu's AI models, with features for image-to-video conversion, task monitoring, and image uploading.

  1. Features
    1. Prerequisites
      1. Installation
        1. Installing via Smithery
        2. Manual Installation
      2. Usage
        1. Tools
          1. 1. Image to Video
          2. 2. Check Generation Status
          3. 3. Upload Image
        2. How It Works
          1. Troubleshooting
            1. Contributing

              Related MCP Servers

              • -
                security
                A
                license
                -
                quality
                A server that provides AI-powered image generation, modification, and processing capabilities through the Model Context Protocol, leveraging Google Gemini models and other image services.
                Last updated -
                13
                MIT License
                • Linux
                • Apple
              • A
                security
                A
                license
                A
                quality
                A TypeScript-based server that converts static images into animated videos with Ghibli-style aesthetics, accessible through Claude Desktop.
                Last updated -
                3
                47
                3
                MIT License
                • Apple
              • -
                security
                A
                license
                -
                quality
                A universal AI server that provides image and video processing tools (background removal, upscaling, vectorization, etc.) for any MCP-compatible client with simple setup.
                Last updated -
                MIT License
                • Apple
                • Linux
              • -
                security
                F
                license
                -
                quality
                This server enables interaction with Google's Video Intelligence API for advanced video analysis, auto-generated using AG2's MCP builder to provide a standardized multi-agent interface.
                Last updated -

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/el-el-san/vidu-mcp-server'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server