出门问问 TTS MCP 服务器

Mobvoi 徽标

先决条件

蟒蛇3.10+；
从出门问问序列猴开放平台获取您的APP_KEY和APP_SECRET，新用户可以领取免费额度。
安装uv （Python 包管理器），使用pip install uv安装或查看uvrepo以了解更多安装方法。

Mobvoi TTS MCP 能做什么？

Mobvoi TTS MCP目前支持以下功能：

语音克隆：根据您提供的URL音频文件链接或本地音频文件进行语音克隆，并返回说话人ID，您可以使用此说话人ID生成语音。
语音合成：您可以指定说话人ID，将指定的文本内容生成语音。此外，您还可以调整语速、音量等语音属性。详细信息请参阅我们出门问问Sequence Monkey开放平台TTS部分的文档。
语音播报：播放指定的音频文件。

使用 Cursor 快速入门

进入 Cursor -> Cursor Settings -> MCP，点击Add new global MCP server ，打开 mcp.json 文件，粘贴以下配置内容：

"MobvoiTTS": {
        "command": "uvx",
        "args": [
          "mobvoi-tts-mcp"
        ],
        "env": {
          "APP_KEY": "<insert-your-APP_KEY-here>",
          "APP_SECRET": "<insert-your-APP_SECRET-here>"
        },
      },

使用 Claude Desktop 快速入门

进入 Claude Desktop -> 设置 -> 开发者，点击Edit Config ，打开claude_desktop_config.json ，粘贴以下配置内容：

"MobvoiTTS": {
        "command": "uvx",
        "args": [
          "mobvoi-tts-mcp"
        ],
        "env": {
          "APP_KEY": "<insert-your-APP_KEY-here>",
          "APP_SECRET": "<insert-your-APP_SECRET-here>"
        },
      },

Cline 快速入门

在 VSCode EXTENSIONS 上安装 Cline 扩展，进入 Cline -> MCP Servers -> Installed，点击Config MCP Servers ，会打开cline_mcp_settings.json文件，粘贴如下配置内容：

"MobvoiTTS": {
        "command": "uvx",
        "args": [
          "mobvoi-tts-mcp"
        ],
        "env": {
          "APP_KEY": "<insert-your-APP_KEY-here>",
          "APP_SECRET": "<insert-your-APP_SECRET-here>"
        },
        "transportType": "stdio"
      },

对于 MacOS 和 Linux 系统，您可以参考上述配置。我们尚未测试 Windows 系统。

源代码测试

如果您想基于源码进行测试或者基于本仓库进行二次开发，可以按照如下方式配置：

"MobvoiTTSLocal": {
      "disabled": false,
      "timeout": 60,
      "command": "uv",
      "args": [
        "--directory",
        "<path-to-mobvoi_tts-mcp>/mobvoi_tts_mcp",
        "run",
        "server.py"
      ],
      "env": {
          "APP_KEY": "<insert-your-APP_KEY-here>",
          "APP_SECRET": "<insert-your-APP_SECRET-here>"
      },
      "transportType": "stdio"
    },

以Cline为例，其他客户端的配置类似。

示例用法

尝试从您的音频文件（本地或远程）克隆一个声音，在 Cursor 代理模式下输入以下内容：“ https://tc-nj-backend-pub-cdn.mobvoi.com/subtitles/wav/9e5d439e0e9142966037fb80fe9e0d8e.wav ，克隆此声音”
指定说话人，将文本合成语音并播放。提示模型如下：“使用刚刚克隆的声音播报：‘欢迎体验出门问问 TTS MCP’。”
演示视频：

故障排除

生成 uvx ENOENT

如果您遇到错误“MCP Mobvoi TTS: spawn uvx ENOENT”，请在终端中运行以下命令确认其绝对路径： which uvx获取绝对路径（例如，/usr/local/bin/uvx）后，请更新您的配置以使用该路径（例如，"command": "/usr/local/bin/uvx"）。这可确保引用正确的可执行文件。

MCP 错误 -32001：请求超时

如果您遇到此错误，则表明您的网络存在问题。如果您位于中国大陆，我们强烈建议您按以下方式配置额外的 pypi 源：

"MobvoiTTS": {
        ...
        "args": [
          "--index", 
          "https://pypi.tuna.tsinghua.edu.cn/simple",
          "mobvoi-tts-mcp"
        ],
       ...
      },

请注意，需要在参数的最前面配置额外的 pypi 源。

无法同步最新的 PyPI 包

如果您遇到此情况，可能由以下原因造成：1）网络问题；2）缓存问题；3）指定的镜像源未同步 mobvoi-tts-mcp 包。如果您使用镜像源，请先检查您使用的镜像源上 mobvoi-tts-mcp 包是否已同步，方法如下： pip index versions --index-url https://pypi.tuna.tsinghua.edu.cn/simple mobvoi-tts-mcp如果您看到 LATEST 版本号与 PyPI 上的一致，则可以使用该镜像源更新最新的 mobvoi-tts-mcp 包。否则，您只能使用https://pypi.org/simple进行更新。通常 PyPI 发布新包后，镜像源同步需要几十分钟的延迟。同时，您可以参考以下配置进行更新并清除缓存。

"MobvoiTTS": {
        ...
        "args": [
          "--upgrade",
          "--no-cache-dir",
          "--index", 
          "https://pypi.tuna.tsinghua.edu.cn/simple",
          "mobvoi-tts-mcp"
        ],
       ...
      },

Install Server

HTTP connection URL

security – no known vulnerabilities

license - permissive license

quality - confirmed to work

How are these scores calculated?

Tools

模型上下文协议服务器可与 Mobvoi 的文本转语音和语音克隆 API 进行交互，从而允许 Cursor、Claude Desktop 和 Cline 等 MCP 客户端生成语音和克隆语音。

Related Resources

Reddit Discussion about this server

Related MCP Servers

TTS-MCP
nakamurau1
-
security
A
license
-
quality
A Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.
Last updated -
TypeScript
MIT License
Rime MCP
MatthewDailey
A
security
A
license
A
quality
A Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.
Last updated -
1
15
4
JavaScript
The Unlicense
ElevenLabs MCP Serverofficial
elevenlabs
A
security
A
license
A
quality
An official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.
Last updated -
19
771
Python
MIT License
Gladia MCPofficial
gladiaio
-
security
-
license
-
quality
Official Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.
Last updated -
Python
MIT License

View all related MCP servers

Mobvoi TTS MCP Server