Voicevox MCP Server

MIT License
2
  • Linux

Integrations

  • Used for configuring environment variables like VOICEVOX API URL and speaker ID settings.

  • Enables running the VOICEVOX MCP server in a containerized environment, with specific configurations for audio output in WSL2.

  • Used for cloning the repository during installation.

Voicevox MCP 服务器

这是通过 MCP(模型上下文协议)使用 VOICEVOX 兼容语音合成服务器(AivisSpeech / VOICEVOX / COEIROINK)的服务器。它可以用于使用 Cursor 等中的 Claude 3.7 在代理模式下进行语音合成。

先决条件

Windows 环境

Docker 环境(WSL2)

  • Docker 和 Docker Compose
  • WSL2
  • VOICEVOX ENGINE 等(本地运行或在 Docker 中运行)
  • sudo apt install libsdl2-dev pulseaudio-utils pulseaudio的Linux环境
  • /mnt/wslg的访问权限

安装和配置

  1. 克隆存储库
git clone https://github.com/Dosugamea/voicevox-mcp-server.git cd voicevox-mcp-server
  1. 安装依赖项
npm install
  1. 设置环境变量通过复制.env_example并根据需要修改设置来创建.env文件:
VOICEVOX_API_URL=http://localhost:50021 VOICEVOX_SPEAKER_ID=1

如何做

在Windows环境中执行

请按照以下步骤从编辑器单独启动服务器。

npm run build npm start

Docker环境中执行

无需单独的编辑器或操作。它不能直接执行,因为它以 stdio 模式启动。

如何设置

在 Windows 环境中运行时

请将以下内容添加到 mcp.json。连接不稳定,如果断开,请重新连接。

"voicevox": { "url": "http://localhost:10100/sse" }

在 Docker 环境中运行时

请将以下内容添加到 mcp.json。 (作者环境未测试。)

{ "tools": { "voicevox": { "command": "cmd", "args": [ "/c", "docker", "run", "-i", "--rm", "-v", "/mnt/wslg:/mnt/wslg", "-e", "PULSE_SERVER", "-e", "SDL_AUDIODRIVER", "-e", "VOICEVOX_API_URL", "-e", "VOICEVOX_SPEAKER_ID", "your-local-docker-image-name" ], "env": { "PULSE_SERVER": "unix:/mnt/wslg/PulseServer", "SDL_AUDIODRIVER": "pulseaudio", "VOICEVOX_API_URL": "http://host.docker.internal:50031", "VOICEVOX_SPEAKER_ID": "919692871" } } } }

关于Speaker ID

扬声器 ID 根据您使用的 VOICEVOX 型号而有所不同。默认使用“1”(四国金属)。如果您想使用其他扬声器 ID,请更改环境变量VOICEVOX_SPEAKER_ID

可以在 VOICEVOX ENGINE API 的/speakers端点找到说话者 ID 列表。例如: curl http://localhost:50021/speakers

故障排除

  • VOICEVOX 连接错误:请确保 VOICEVOX ENGINE 正在运行并且 API URL 设置正确。
  • 没有播放声音:确保 VLC 已正确安装并位于您的路径中。
  • Docker 环境中的音频输出问题:请检查 pulseaudio 是否配置正确。

开发者信息

  • 要为源代码做出贡献,请创建问题或提交拉取请求。
  • 要报告错误或请求功能,请使用 GitHub 上的问题功能。

执照

MIT 许可证

-
security - not tested
A
license - permissive license
-
quality - not tested

该服务器使 Claude 3.7 和其他 AI 代理能够通过模型上下文协议访问与 VOICEVOX 兼容的语音合成引擎(AivisSpeech、VOICEVOX、COEIROINK)。

  1. 必要条件
    1. Windows環境
    2. Docker環境 (WSL2)
  2. インストールと設定
    1. 実行方法
      1. Windows環境での実行
      2. Docker環境での実行
    2. 設定方法
      1. Windows環境での実行の場合
      2. Docker環境での実行の場合
    3. 話者IDについて
      1. トラブルシューティング
        1. 開発者向け情報
          1. ライセンス
            ID: goem3ufopt