语音 MCP 服务器
使用 Kokoro TTS 模型提供文本转语音功能的模型上下文协议服务器。
配置
可以使用以下环境变量配置服务器:
多变的 | 描述 | 默认 | 有效范围 |
---|---|---|---|
MCP_DEFAULT_SPEECH_SPEED | 文本转语音的默认速度倍增器 | 1.1 | 0.5 至 2.0 |
在光标中:
特征
- 🎯 使用 Kokoro TTS 模型实现高质量文本转语音
- 🗣️ 有多种语音选项
- 🎛️可定制的语音参数(声音、速度)
- 🔌 符合 MCP 标准的接口
- 📦易于安装和设置
- 🚀 无需 API 密钥
安装
用法
运行服务器:
该服务器提供以下 MCP 工具:
text_to_speech
:基本文本到语音的转换text_to_speech_with_options
:可自定义速度的文本转语音list_voices
:列出所有可用的声音get_model_status
:检查 TTS 模型的初始化状态
发展
可用工具
1. 文本转语音
使用默认设置将文本转换为语音。
2. 文本转语音(带选项)
使用可自定义的参数将文本转换为语音。
3. 列表声音
列出所有可用于文本转语音的声音。
4. 获取模型状态
检查 TTS 模型初始化的当前状态。这在首次启动服务器时特别有用,因为需要下载并初始化模型。
响应示例:
可能的状态值:
uninitialized
:模型初始化尚未开始initializing
:模型正在下载并初始化ready
:模型已准备好使用error
:初始化过程中发生错误
测试
您可以使用 MCP 检查器或通过发送原始 JSON 消息来测试服务器:
与 Claude Desktop 集成
要将此服务器与 Claude Desktop 一起使用,请将以下内容添加到您的 Claude Desktop 配置文件( ~/Library/Application Support/Claude/claude_desktop_config.json
):
贡献
欢迎贡献代码!欢迎提交 Pull 请求。
执照
MIT 许可证 - 有关详细信息,请参阅LICENSE文件。
故障排除
模型初始化问题
服务器启动时会自动尝试下载并初始化 TTS 模型。如果遇到初始化错误:
- 服务器将自动重试最多 3 次,并在每次尝试之间进行清理
- 使用
get_model_status
工具监控初始化进度和任何错误 - 如果所有重试后初始化仍失败,请尝试手动删除模型文件:
get_model_status
工具现在将在其响应中包含重试信息:
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
模型上下文协议服务器使用 Kokoro TTS 模型提供文本转语音功能,提供多种语音选项和可定制的语音参数。
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
- -securityAlicense-qualityA Model Context Protocol server that enables AI models to interact with VoIPBin's VoIP services, supporting features like call management, agent management, campaigns, conferences, and chat functionality.Last updated -2PythonMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -1154JavaScriptThe Unlicense
Appeared in Searches
- A service to convert text to ready-to-use audio with download, player, or embed options
- Using Hugging Face for Text-to-Audio, Image, and Video Generation
- A search for translation services or tools
- A system for retrieving medical knowledge, especially in medical imaging, and generating reports
- Creating an AI Chatbot for a Shopify Store