Voicevox MCP Server

MIT License
2
  • Linux

Integrations

  • Used for configuring environment variables like VOICEVOX API URL and speaker ID settings.

  • Enables running the VOICEVOX MCP server in a containerized environment, with specific configurations for audio output in WSL2.

  • Used for cloning the repository during installation.

Servidor MCP de Voicevox

Este es un servidor para utilizar servidores de síntesis de voz compatibles con VOICEVOX (AivisSpeech / VOICEVOX / COEIROINK) a través de MCP (Model Context Protocol). Se puede utilizar para la síntesis de voz en modo agente usando Claude 3.7 en Cursor, etc.

Prerrequisitos

Entorno de Windows

Entorno Docker (WSL2)

  • Docker y Docker Compose
  • WSL2
  • MOTOR VOICEVOX, etc. (se ejecuta localmente o en Docker)
  • sudo apt install libsdl2-dev pulseaudio-utils pulseaudio
  • Permisos de acceso a /mnt/wslg

Instalación y configuración

  1. Clonar el repositorio
git clone https://github.com/Dosugamea/voicevox-mcp-server.git cd voicevox-mcp-server
  1. Instalación de dependencias
npm install
  1. Configuración de variables de entorno Cree un archivo .env copiando .env_example y modificando la configuración según sea necesario:
VOICEVOX_API_URL=http://localhost:50021 VOICEVOX_SPEAKER_ID=1

Cómo hacerlo

Ejecución en entorno Windows

Inicie un servidor por separado del editor siguiendo los pasos a continuación.

npm run build npm start

Ejecución en entorno Docker

No se requiere ningún editor ni operación independiente. No se puede ejecutar directamente porque se inicia en modo stdio.

Cómo configurarlo

Cuando se ejecuta en un entorno Windows

Agregue lo siguiente a mcp.json. La conexión es inestable, por lo que debe volver a conectarla si se desconecta.

"voicevox": { "url": "http://localhost:10100/sse" }

Cuando se ejecuta en un entorno Docker

Agregue lo siguiente a mcp.json. (El entorno del autor no ha sido probado).

{ "tools": { "voicevox": { "command": "cmd", "args": [ "/c", "docker", "run", "-i", "--rm", "-v", "/mnt/wslg:/mnt/wslg", "-e", "PULSE_SERVER", "-e", "SDL_AUDIODRIVER", "-e", "VOICEVOX_API_URL", "-e", "VOICEVOX_SPEAKER_ID", "your-local-docker-image-name" ], "env": { "PULSE_SERVER": "unix:/mnt/wslg/PulseServer", "SDL_AUDIODRIVER": "pulseaudio", "VOICEVOX_API_URL": "http://host.docker.internal:50031", "VOICEVOX_SPEAKER_ID": "919692871" } } } }

Acerca de la identificación del orador

La identificación del altavoz varía según el modelo de VOICEVOX que utilice. El valor predeterminado es utilizar "1" (Shikoku Metal). Si desea utilizar otro ID de altavoz, cambie la variable de entorno VOICEVOX_SPEAKER_ID .

La lista de identificaciones de oradores se puede encontrar en /speakers de la API VOICEVOX ENGINE. Ejemplo: curl http://localhost:50021/speakers

solución de problemas

  • Error de conexión con VOICEVOX : asegúrese de que VOICEVOX ENGINE se esté ejecutando y que la URL de la API esté configurada correctamente.
  • No se reproduce sonido : asegúrese de que VLC esté instalado correctamente y en su ruta.
  • Problema de salida de audio en el entorno Docker : verifique que pulseaudio esté configurado correctamente.

Información para desarrolladores

  • Para contribuir al código fuente, cree un problema o envíe una solicitud de extracción.
  • Para informar errores o solicitar funciones, utilice la función Problemas en GitHub.

licencia

Licencia MIT

-
security - not tested
A
license - permissive license
-
quality - not tested

Un servidor que permite a Claude 3.7 y otros agentes de IA acceder a motores de síntesis de voz compatibles con VOICEVOX (AivisSpeech, VOICEVOX, COEIROINK) a través del Protocolo de Contexto de Modelo.

  1. 必要条件
    1. Windows環境
    2. Docker環境 (WSL2)
  2. インストールと設定
    1. 実行方法
      1. Windows環境での実行
      2. Docker環境での実行
    2. 設定方法
      1. Windows環境での実行の場合
      2. Docker環境での実行の場合
    3. 話者IDについて
      1. トラブルシューティング
        1. 開発者向け情報
          1. ライセンス
            ID: goem3ufopt