generate_voice
Convert text to speech with customizable voice actors, speed, emotion, and format to create audio files for various applications.
Instructions
音声を生成してその結果を返す
Args:
script: 読み上げるテキスト(最大3,000文字)(必須)
actor_id: 使用するVoice ActorのID(省略時は利用可能な最初のアクターを使用)
speed: 読み上げスピード(0.4~3.0、デフォルト: 1.0)
emotional_level: 感情レベル(0.0~1.5、デフォルト: -1.0は声優のデフォルトを使用)
sound_duration: 音素発音の長さ(0.0~1.7、デフォルト: -1.0は声優のデフォルトを使用)
format: 音声フォーマット("mp3"または"wav"、デフォルト: "mp3")
Returns:
以下を含む音声生成レスポンス:
- audioFileUrl: 音声再生用のURL
- audioFileDownloadUrl: 音声ダウンロード用のURL
- duration: 音声の長さ(ミリ秒)
- remainingCredits: 生成後の残りクレジット
Input Schema
TableJSON Schema
| Name | Required | Description | Default |
|---|---|---|---|
| script | Yes | ||
| actor_id | No | ||
| speed | No | ||
| emotional_level | No | ||
| sound_duration | No | ||
| format | No | mp3 |