aivis-speech-synthesis
Convert text to high-quality speech using customizable parameters like speaker ID, style, speed, pitch, and volume. Integrate the tool via the AivisSpeech MCP Server API for AI-powered voice synthesis.
Input Schema
Name | Required | Description | Default |
---|---|---|---|
intonation_scale | No | イントネーションのスケール(1.0が標準) | |
output_sampling_rate | No | 出力音声のサンプリングレート(Hz) | |
pitch_scale | No | 音高のスケール(1.0が標準) | |
post_phoneme_length | No | 音声の末尾の無音時間(秒) | |
pre_phoneme_length | No | 音声の先頭の無音時間(秒) | |
speaker_id | No | 音声合成に使用するスピーカーのID | |
speed_scale | No | 話速のスケール(1.0が標準) | |
style_id | No | 音声合成に使用するスタイルのID | |
text | Yes | 音声合成するテキスト | |
volume_scale | No | 音量のスケール(1.0が標準) |
Input Schema (JSON Schema)
{
"$schema": "http://json-schema.org/draft-07/schema#",
"additionalProperties": false,
"properties": {
"intonation_scale": {
"default": 1,
"description": "イントネーションのスケール(1.0が標準)",
"maximum": 2,
"minimum": 0,
"type": "number"
},
"output_sampling_rate": {
"default": 24000,
"description": "出力音声のサンプリングレート(Hz)",
"type": "number"
},
"pitch_scale": {
"default": 1,
"description": "音高のスケール(1.0が標準)",
"maximum": 2,
"minimum": 0.5,
"type": "number"
},
"post_phoneme_length": {
"default": 0.1,
"description": "音声の末尾の無音時間(秒)",
"maximum": 1,
"minimum": 0,
"type": "number"
},
"pre_phoneme_length": {
"default": 0.1,
"description": "音声の先頭の無音時間(秒)",
"maximum": 1,
"minimum": 0,
"type": "number"
},
"speaker_id": {
"description": "音声合成に使用するスピーカーのID",
"type": "number"
},
"speed_scale": {
"default": 1,
"description": "話速のスケール(1.0が標準)",
"maximum": 2,
"minimum": 0.5,
"type": "number"
},
"style_id": {
"description": "音声合成に使用するスタイルのID",
"type": "number"
},
"text": {
"description": "音声合成するテキスト",
"type": "string"
},
"volume_scale": {
"default": 1,
"description": "音量のスケール(1.0が標準)",
"maximum": 2,
"minimum": 0,
"type": "number"
}
},
"required": [
"text"
],
"type": "object"
}