Mobvoi TTS MCP Server

by mobvoi
MIT License
1
  • Apple
  • Linux

Integrations

  • Hosts the mobvoi-tts-mcp package, allowing users to install the server via PyPI repositories.

  • The MCP server is built on Python and requires Python 3.10+ for operation.

先决条件

  1. 蟒蛇3.10+;
  2. 出门问问序列猴开放平台获取您的APP_KEY和APP_SECRET,新用户可以领取免费额度。
  3. 安装uv (Python 包管理器),使用pip install uv安装或查看uvrepo以了解更多安装方法。

Mobvoi TTS MCP 能做什么?

Mobvoi TTS MCP目前支持以下功能:

  1. 语音克隆:根据您提供的URL音频文件链接或本地音频文件进行语音克隆,并返回说话人ID,您可以使用此说话人ID生成语音。
  2. 语音合成:您可以指定说话人ID,将指定的文本内容生成语音。此外,您还可以调整语速、音量等语音属性。详细信息请参阅我们出门问问Sequence Monkey开放平台TTS部分的文档。
  3. 语音播报:播放指定的音频文件。

使用 Cursor 快速入门

进入 Cursor -> Cursor Settings -> MCP,点击Add new global MCP server ,打开 mcp.json 文件,粘贴以下配置内容:

"MobvoiTTS": { "command": "uvx", "args": [ "mobvoi-tts-mcp" ], "env": { "APP_KEY": "<insert-your-APP_KEY-here>", "APP_SECRET": "<insert-your-APP_SECRET-here>" }, },

使用 Claude Desktop 快速入门

进入 Claude Desktop -> 设置 -> 开发者,点击Edit Config ,打开claude_desktop_config.json ,粘贴以下配置内容:

"MobvoiTTS": { "command": "uvx", "args": [ "mobvoi-tts-mcp" ], "env": { "APP_KEY": "<insert-your-APP_KEY-here>", "APP_SECRET": "<insert-your-APP_SECRET-here>" }, },

Cline 快速入门

在 VSCode EXTENSIONS 上安装 Cline 扩展,进入 Cline -> MCP Servers -> Installed,点击Config MCP Servers ,会打开cline_mcp_settings.json文件,粘贴如下配置内容:

"MobvoiTTS": { "command": "uvx", "args": [ "mobvoi-tts-mcp" ], "env": { "APP_KEY": "<insert-your-APP_KEY-here>", "APP_SECRET": "<insert-your-APP_SECRET-here>" }, "transportType": "stdio" },

对于 MacOS 和 Linux 系统,您可以参考上述配置。我们尚未测试 Windows 系统。

源代码测试

如果您想基于源码进行测试或者基于本仓库进行二次开发,可以按照如下方式配置:

"MobvoiTTSLocal": { "disabled": false, "timeout": 60, "command": "uv", "args": [ "--directory", "<path-to-mobvoi_tts-mcp>/mobvoi_tts_mcp", "run", "server.py" ], "env": { "APP_KEY": "<insert-your-APP_KEY-here>", "APP_SECRET": "<insert-your-APP_SECRET-here>" }, "transportType": "stdio" },

以Cline为例,其他客户端的配置类似。

示例用法

  1. 尝试从您的音频文件(本地或远程)克隆一个声音,在 Cursor 代理模式下输入以下内容:“ https://tc-nj-backend-pub-cdn.mobvoi.com/subtitles/wav/9e5d439e0e9142966037fb80fe9e0d8e.wav ,克隆此声音”
  2. 指定说话人,将文本合成语音并播放。提示模型如下:“使用刚刚克隆的声音播报:‘欢迎体验出门问问 TTS MCP’。”
  3. 演示视频:

故障排除

生成 uvx ENOENT

如果您遇到错误“MCP Mobvoi TTS: spawn uvx ENOENT”,请在终端中运行以下命令确认其绝对路径: which uvx获取绝对路径(例如,/usr/local/bin/uvx)后,请更新您的配置以使用该路径(例如,"command": "/usr/local/bin/uvx")。这可确保引用正确的可执行文件。

MCP 错误 -32001:请求超时

如果您遇到此错误,则表明您的网络存在问题。如果您位于中国大陆,我们强烈建议您按以下方式配置额外的 pypi 源:

"MobvoiTTS": { ... "args": [ "--index", "https://pypi.tuna.tsinghua.edu.cn/simple", "mobvoi-tts-mcp" ], ... },

请注意,需要在参数的最前面配置额外的 pypi 源。

无法同步最新的 PyPI 包

如果您遇到此情况,可能由以下原因造成:1)网络问题;2)缓存问题;3)指定的镜像源未同步 mobvoi-tts-mcp 包。如果您使用镜像源,请先检查您使用的镜像源上 mobvoi-tts-mcp 包是否已同步,方法如下: pip index versions --index-url https://pypi.tuna.tsinghua.edu.cn/simple mobvoi-tts-mcp如果您看到 LATEST 版本号与 PyPI 上的一致,则可以使用该镜像源更新最新的 mobvoi-tts-mcp 包。否则,您只能使用https://pypi.org/simple进行更新。通常 PyPI 发布新包后,镜像源同步需要几十分钟的延迟。同时,您可以参考以下配置进行更新并清除缓存。

"MobvoiTTS": { ... "args": [ "--upgrade", "--no-cache-dir", "--index", "https://pypi.tuna.tsinghua.edu.cn/simple", "mobvoi-tts-mcp" ], ... },

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

模型上下文协议服务器可与 Mobvoi 的文本转语音和语音克隆 API 进行交互,从而允许 Cursor、Claude Desktop 和 Cline 等 MCP 客户端生成语音和克隆语音。

  1. Mobvoi TTS MCP 能做什么?
    1. 使用 Cursor 快速入门
      1. 使用 Claude Desktop 快速入门
        1. Cline 快速入门
          1. 源代码测试
            1. 示例用法
              1. 故障排除
                1. 生成 uvx ENOENT
                2. MCP 错误 -32001:请求超时
                3. 无法同步最新的 PyPI 包

              Related MCP Servers

              • -
                security
                A
                license
                -
                quality
                A Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.
                Last updated -
                TypeScript
                MIT License
              • A
                security
                A
                license
                A
                quality
                A Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.
                Last updated -
                1
                176
                4
                JavaScript
                The Unlicense
                • Apple
                • Linux
              • A
                security
                A
                license
                A
                quality
                An official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.
                Last updated -
                19
                633
                Python
                MIT License
                • Apple
              • -
                security
                -
                license
                -
                quality
                Official Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.
                Last updated -
                Python
                MIT License

              View all related MCP servers

              ID: s2oudyvkuo