Flyworks MCP: 無料かつ高速なゼロショットリップシンクツール
概要
Flyworks MCPは、Flyworks APIとのやり取りに便利なインターフェースを提供するModel Context Protocol(MCP)サーバーです。リアルなスタイルからカートゥーンスタイルまで、幅広いデジタルアバターに対応したリップシンク動画を、高速かつ無料で作成できます。
デモ
入力アバタービデオ(映像):
我是一个飞影数字人。Welcome to Flyworks MCP server demo. This tool enables fast and free lipsync video creation for a wide range of digital avatars, including realistic and cartoon styles.
生成されたリップシンクビデオ:
特徴
- デジタルアバターのビデオとオーディオを入力として使用してリップシンクビデオを作成します
- テキスト(音声合成機能付き)でリップシンク動画を作成する
- 画像や動画からデジタルヒューマンアバターを作成する
- 非同期と同期の両方の動作モードをサポート
- さらに多くの機能が近日中に登場します...
要件
- Python 3.8以上
- 依存関係:
httpx
、mcp[cli]
使用法
Claude またはその他の MCP クライアントとの統合
Claude Desktopでの使用
Claude > Settings > Developer > Edit Config > claude_desktop_config.json
に移動して、以下を追加します。
カーソル内で使用する
上記の設定を追加するには、 Cursor -> Preferences -> Cursor Settings -> MCP -> Add new global MCP Server
に移動します。
your_api_token_here
実際の API トークンに置き換え、 FLYWORKS_MCP_BASE_PATH
出力ファイルが保存されるシステム上の有効なディレクトリに更新してください。
**注:**トークン
2aeda3bcefac46a3
でツールの無料トライアルアクセスをご提供しています。ただし、この無料アクセスの1日あたりの割り当て量には制限があることにご注意ください。また、生成された動画には透かしが入り、再生時間は45秒に制限されます。フルアクセスをご希望の場合は、 bd@flyworks.aiまでご連絡いただき、トークンを取得してください。
Smithery経由でインストール
Smithery経由で Claude Desktop 用の flyworks-mcp を自動的にインストールするには:
ローカルにインストール
- このリポジトリをクローンします:
- 依存関係をインストールします:または
uv
を使用します:サーバーの起動時にタイムアウトの問題を回避するには、すべての依存関係を事前にインストールすることをお勧めします。 - 構成
Flyworks API トークンを環境変数として設定します。
あるいは、 .env
ファイルを作成することもできます。
- サーバーの実行
server.py
ファイルを直接実行します。
spawn uvx ENOENT の問題:
ターミナルで次のコマンドを実行して絶対パスを確認してください:
絶対パス (例: /usr/local/bin/uvx) を取得したら、そのパスを使用するように設定を更新します (例: "command": "/usr/local/bin/uvx")。
ツールの説明
1. オーディオでリップシンクビデオを作成する( create_lipsync_video_by_audio
)
音声入力によるリップシンク動画を作成します。デジタルヒューマンアバターが、入力された音声に合わせて話すアニメーションを作成します。
パラメータ:
avatar
:デジタルヒューマンアバターID。このIDまたはアバター作成パラメータのいずれかを指定する必要があります。avatar_video_url
: アバターを作成するビデオの URL。avatar_image_url
: アバターを作成する画像の URL。avatar_video_file
: アバターを作成するビデオ ファイルへのローカル パス。avatar_image_file
: アバターを作成するための画像ファイルへのローカル パス。audio_url
: オーディオファイルのリモートURL。audio_urlまたはaudio_fileのいずれかを指定する必要があります。audio_file
: オーディオファイルへのローカルパス。audio_url または audio_file のいずれかを指定する必要があります。title
: 作成されたビデオのオプションのタイトル。async_mode
: true の場合、task_id を直ちに返します。false の場合、完了を待ってからビデオをダウンロードします。デフォルトは true です。output_path
: async_mode が false の場合にダウンロードしたビデオを保存する場所。デフォルトは「output.mp4」です。
注記:
- アバター作成の場合、avatar_video_url、avatar_image_url、avatar_video_file、avatar_image_file のいずれか 1 つを指定します。
- アバター ID が直接提供される場合、これらのパラメータは無視されます。
戻り値:
- async_mode が true の場合: 後でステータスを確認するための task_id と created_avatar (新しいアバターが作成された場合)
- async_mode が false の場合: ダウンロードしたビデオのパス、タスクの結果、および created_avatar (該当する場合)
2. テキストでリップシンクビデオを作成する( create_lipsync_video_by_text
)
テキスト入力でリップシンク動画を作成します。テキストから音声を生成し、デジタルヒューマンアバターに音声を吹き込みます。
パラメータ:
avatar
:デジタルヒューマンアバターID。このIDまたはアバター作成パラメータのいずれかを指定する必要があります。avatar_video_url
: アバターを作成するビデオの URL。avatar_image_url
: アバターを作成する画像の URL。avatar_video_file
: アバターを作成するビデオ ファイルへのローカル パス。avatar_image_file
: アバターを作成するための画像ファイルへのローカル パス。text
: アバターが話すテキストコンテンツ。必須。voice
: テキスト読み上げに使用する音声ID。指定しない場合は、ランダムな音声が自動的に選択されます。title
: 作成されたビデオのオプションのタイトル。async_mode
: true の場合、task_id を直ちに返します。false の場合、完了を待ってからビデオをダウンロードします。デフォルトは true です。output_path
: async_mode が false の場合にダウンロードしたビデオを保存する場所。デフォルトは「output.mp4」です。
注記:
- アバター作成の場合、avatar_video_url、avatar_image_url、avatar_video_file、avatar_image_file のいずれか 1 つを指定します。
- アバター ID が直接提供される場合、これらのパラメータは無視されます。
戻り値:
- async_mode が true の場合: 後でステータスを確認するための task_id、選択された音声 ID、および created_avatar (該当する場合)
- async_mode が false の場合: ダウンロードしたビデオのパス、タスクの結果、選択された音声 ID、および created_avatar (該当する場合)
タスクステータスの確認
非同期モードで実行されるタスクの場合、ツールによって返される task_id を使用して、Flyworks API の/creation/task
エンドポイントを使用してステータスを確認できます。
注記
- ジョブの処理には時間がかかる場合がありますので、しばらくお待ちください。
- ビデオファイルのURLは一時的なものですので、速やかにダウンロードして保存してください。
- ローカルファイルを使用する場合、サーバーは自動的にFlyworksサーバーにアップロードします。
- 同期モードでは、ツールはタスクが完了するまで待機し、ビデオを自動的にダウンロードします。
- 同期モードの最大許容待機時間は10分(600秒)です
- 動画によるアバター作成は通常、品質は高くなりますが、時間がかかります。
- 簡単なテストでは、画像からアバターを作成する方が速いですが、品質が低くなる可能性があります。
関連リンク
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
さまざまなデジタル アバターに対して高速かつ無料のリップシンク ビデオ作成を可能にするモデル コンテキスト プロトコル サーバー。同期された唇の動きを生成するためにオーディオとテキストの両方の入力をサポートします。
Related MCP Servers
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
- -securityFlicense-qualityA Model Context Protocol server that provides Claude with tools to interact with YouTube, built on the mcp-framework.Last updated -TypeScript
- -security-license-qualityModel Context Protocol server that enables generating videos from text prompts and/or images using AI models (Luma Ray2 Flash and Kling v1.6 Pro) with configurable parameters like aspect ratio, resolution, and duration.Last updated -1JavaScriptMIT License
Gladia MCPofficial
-security-license-qualityOfficial Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.Last updated -PythonMIT License