Allows cloning the project repository to set up the MCP server locally
Provides access to the source code repository for installation and configuration
Provides compatibility for Linux environments when setting up and running the MCP server
项目简介
本项目旨在将火山引擎TTS官方API封装为标准MCP协议工具,支持在 Cursor、Claude 等平台通过自然语言参数调用,实现一键语音合成。适用于需要自定义音色、参数映射、自动化批量语音生成的开发者场景。
doubao_tts_mcp 使用说明
快速开始
0. 克隆项目代码
Python环境准备
- 本项目需 Python 3.8 及以上版本。
- 推荐使用 Python官网 下载并安装最新版。
- 安装完成后,命令行输入
python --version
或python3 --version
检查版本。
1. 安装依赖
2. 安装本地包(支持命令行调用)
3. 配置环境变量
可在 .env
或 mcp.json
的 env
字段中设置:
(获取方式:https://console.volcengine.com/speech/service/10007)
- VOLC_APPID
- VOLC_TOKEN
- PORT(如需自定义端口)
- OUTPUT_DIR(音频输出目录)
4. 命令行启动服务
5. cursor mcp.json 配置示例
6. 在 Cursor/Claude 等平台使用
- 平台会自动读取 mcp.json 并用命令行方式启动 MCP 服务。
- 在 MCP 面板填写参数即可一键合成音频。
- 合成结果会返回音频文件的绝对路径,文件保存在指定目录下。
7. 常见问题
- Q:如何让 MCP 工具支持命令行调用?
- A:请确保 pyproject.toml 配置了 entry_points,并用 pip install -e . 安装本地包。
- Q:比特率及采样率无法调整?
- A:由于 MCP 工具 schema 类型校验限制,bitrate 和 rate 参数暂不可用,建议用默认值。
- Q:音色、情感、语速等参数如何填写?
- A:支持自然语言关键词(如"少女""萝莉"),会自动智能映射到官方音色。
示例调用
参考
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
A Model Context Protocol server that wraps Volcengine's Text-to-Speech API, allowing users to generate speech from text using natural language parameters for customizing voice type, emotion, and speed.
Related MCP Servers
- -securityFlicense-qualityA Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.Last updated -239JavaScript
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
Gladia MCPofficial
-security-license-qualityOfficial Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.Last updated -PythonMIT License- -securityFlicense-qualityA Model Context Protocol server that provides text-to-speech functionality for AI agents using Microsoft Edge's text-to-speech technology, supporting multiple voices, languages, and voice customization.Last updated -1Python