configure_voice_and_script
Configure voice model and narration script for a project, synchronize audio with slide pages using character-based marks, and optionally add timed pauses or additional voiceovers at specified positions.
Instructions
设置项目的配音配置、解说文案与声画同步 pageMarks;可选 page_holds:在某段 TTS 结束后插入「画面停留 + 可选旁白或静音」。若某项含可读 narration:对该文案单独 TTS,音长以实测为准(用于解说演示);若无 narration 或仅空白:用 durationMs 纯静音停留。afterChar 必须等于某段口播结束下标(charEnd);纯静音时 durationMs 建议 ≥ 嵌入视频时长(200~120000);整段 TTS+holds 粗估上限 10 分钟。多页口播前须自行划分 page_marks。渲染前须让用户在本机预览页核对,请调用 get_render_preview。
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| project_id | Yes | 项目 ID | |
| script | Yes | 完整解说/配音文案 | |
| voice_model | Yes | 单人配音的音色 ID | |
| page_marks | No | 声画同步:将 script 按字符下标分配到各页。每项 { start, end, pageIdx },区间为 [start,end)(半开),须覆盖 0..script.length 且无重叠、按 start 递增;pageIdx 为幻灯片索引,与 upload_html 的页数一致。多页渲染时必填。 | |
| voice_assignments | No | 多人配音:每页分配不同音色 [{pageIdx, voiceId}] | |
| voice_speed | No | 全局语速(0.5 ~ 2.0,默认 1.0) | |
| speed_marks | No | 分段变速 [{start, end, speed}] | |
| page_holds | No | 可选:TTS 段后画面停留;可读 narration 则旁白 TTS,否则 durationMs 静音。afterChar=某口播段结束下标;与 get_material_guidelines 同读。 |