Voicevox MCP 服务器
这是通过 MCP(模型上下文协议)使用 VOICEVOX 兼容语音合成服务器(AivisSpeech / VOICEVOX / COEIROINK)的服务器。它可以用于使用 Cursor 等中的 Claude 3.7 在代理模式下进行语音合成。
先决条件
Windows 环境
- Node.js 18 或更高版本
- VOICEVOX ENGINE 等(在 http://localhost:50000 等本地运行)
- VLC媒体播放器(必须设置路径)
Docker 环境(WSL2)
- Docker 和 Docker Compose
- WSL2
- VOICEVOX ENGINE 等(本地运行或在 Docker 中运行)
sudo apt install libsdl2-dev pulseaudio-utils pulseaudio
的Linux环境/mnt/wslg
的访问权限
安装和配置
- 克隆存储库
- 安装依赖项
- 设置环境变量通过复制
.env_example
并根据需要修改设置来创建.env
文件:
如何做
在Windows环境中执行
请按照以下步骤从编辑器单独启动服务器。
Docker环境中执行
无需单独的编辑器或操作。它不能直接执行,因为它以 stdio 模式启动。
如何设置
在 Windows 环境中运行时
请将以下内容添加到 mcp.json。连接不稳定,如果断开,请重新连接。
在 Docker 环境中运行时
请将以下内容添加到 mcp.json。 (作者环境未测试。)
关于Speaker ID
扬声器 ID 根据您使用的 VOICEVOX 型号而有所不同。默认使用“1”(四国金属)。如果您想使用其他扬声器 ID,请更改环境变量VOICEVOX_SPEAKER_ID
。
可以在 VOICEVOX ENGINE API 的/speakers
端点找到说话者 ID 列表。例如: curl http://localhost:50021/speakers
故障排除
- VOICEVOX 连接错误:请确保 VOICEVOX ENGINE 正在运行并且 API URL 设置正确。
- 没有播放声音:确保 VLC 已正确安装并位于您的路径中。
- Docker 环境中的音频输出问题:请检查 pulseaudio 是否配置正确。
开发者信息
- 要为源代码做出贡献,请创建问题或提交拉取请求。
- 要报告错误或请求功能,请使用 GitHub 上的问题功能。
执照
MIT 许可证
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
该服务器使 Claude 3.7 和其他 AI 代理能够通过模型上下文协议访问与 VOICEVOX 兼容的语音合成引擎(AivisSpeech、VOICEVOX、COEIROINK)。
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityFlicense-qualityA Model Context Protocol server that enables AI assistants to utilize AivisSpeech Engine's high-quality voice synthesis capabilities through a standardized API interface.Last updated -TypeScript
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -1154JavaScriptThe Unlicense
- -securityAlicense-qualityA Model Context Protocol server that enables AI assistants like Claude to initiate and manage real-time voice calls using Twilio and OpenAI's voice models.Last updated -14TypeScriptMIT License