📢 Blabber-MCP🗣️
一个 MCP 服务器,使用 OpenAI 的文本转语音 API 为你的 LLM 提供语音功能!🔊
✨ 特点
- **文本转语音:**将输入文本转换为高质量的语音音频。
- **语音选择:**从各种 OpenAI 语音中进行选择(
alloy
、echo
、fable
、onyx
、nova
、shimmer
)。 - **型号选择:**使用标准型(
tts-1
)或高清型(tts-1-hd
)型号。 - **格式选项:**以
mp3
、opus
、aac
或flac
获取音频输出。 - **文件保存:**将生成的音频保存到本地文件。
- **可选播放:**使用可配置的系统命令自动播放生成的音频。
- **可配置的默认值:**通过配置设置默认语音。
🔧 配置
要使用此服务器,您需要将其配置添加到 MCP 客户端的设置文件(例如mcp_settings.json
)。
- **获取 OpenAI API 密钥:**您需要一个来自OpenAI的 API 密钥。
- **添加到 MCP 设置:**将以下块添加到设置文件中的
mcpServers
对象,并用您的实际密钥替换"YOUR_OPENAI_API_KEY"
。
**重要提示:**请确保args
路径指向blabber-mcp
项目目录中build/index.js
文件的正确位置。请使用完整的绝对路径。
🚀 使用方法
配置并运行后,您可以通过 MCP 客户端使用text_to_speech
工具。
工具: text_to_speech
服务器: blabber-mcp
(或您在配置中使用的密钥)
参数:
input
(字符串,必需):要合成的文本。voice
(字符串,可选):要使用的语音(alloy
、echo
、fable
、onyx
、nova
、shimmer
)。默认为配置中设置的DEFAULT_TTS_VOICE
或nova
。model
(字符串,可选):模型 (tts-1
,tts-1-hd
)。默认为tts-1
。response_format
(字符串,可选):音频格式 (mp3
,opus
,aac
,flac
)。默认为mp3
。play
(布尔值,可选):设置为true
则保存后自动播放音频。默认为false
。
工具调用示例(带回放):
输出:
该工具将音频文件保存到blabber-mcp
项目文件夹内的output/
目录,并返回如下 JSON 响应:
📜 许可证
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅LICENSE文件。
🕒 更新日志
有关版本历史的详细信息,请参阅CHANGELOG.md文件。
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
MCP 服务器使 LLM 能够使用 OpenAI 的文本转语音 API 从文本生成语音,支持各种语音、模型和音频格式。
Related MCP Servers
- AsecurityAlicenseAqualityA MCP server that enables transcription of audio files using OpenAI's Speech-to-Text API, with support for multiple languages and file saving options.Last updated -12JavaScriptMIT License
ElevenLabs MCP Serverofficial
AsecurityAlicenseAqualityAn official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.Last updated -19700PythonMIT License- -security-license-qualityAn MCP server that enables LLMs to access the NijiVoice API for text-to-speech generation, supporting features like fetching available voice actors and checking credit balance.Last updated -1PythonMIT License
- -securityFlicense-qualityAn MCP server that downloads videos/extracts audio from various platforms like YouTube, Bilibili, and TikTok, then transcribes them to text using OpenAI's Whisper model.Last updated -2Python