Servidor de voz interactiva MCP (Kokoro TTS + NeMo ASR)
Un servidor de protocolo de contexto de modelo que proporciona capacidades de texto a voz (TTS) mediante Kokoro y capacidades de voz a texto (STT) mediante modelos NVIDIA NeMo Parakeet, lo que permite diálogos de voz interactivos.
Herramientas disponibles
interactive_voice_dialog: sintetiza texto a voz, lo reproduce, luego escucha la entrada de voz del usuario y devuelve la transcripción.Argumentos obligatorios:
text_to_speak(cadena): El texto que el asistente debe decir.
Argumentos opcionales:
voice(cadena): La voz que se usará para TTS (p. ej., 'af_heart'). El valor predeterminado es 'af_heart'.
Instalación
Prerrequisitos
Algunos de los modelos TTS subyacentes requieren que espeak-ng esté instalado en su sistema.
Instalación de Windows:
Vaya a los lanzamientos de espeak-ng .
Haga clic en "Último lanzamiento".
Descargue el archivo
*.msiapropiado (por ejemploespeak-ng-20191129-b702b03-x64.msi).Ejecute el instalador descargado.
Instalación de Desarrollo Local
Para que Claude Desktop pueda iniciar este servidor con python -m mcp_server_tts , debe instalarlo como módulo de Python. Se recomienda instalarlo en modo "editable" ( -e ) para desarrollo, ya que los cambios en el código fuente se reflejan inmediatamente sin necesidad de reinstalar.
Navegue al directorio que contiene el archivo pyproject.toml (la raíz de este proyecto de servidor) y ejecute:
Después de la instalación, puedes ejecutarlo como un script usando:
Related MCP server: Zonos TTS MCP Server
Configuración
Para usar este servidor con Claude Desktop, debe agregarlo a su archivo claude_desktop_config.json . La ubicación de este archivo suele ser: C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.json
Agregue la siguiente entrada bajo el objeto mcpServers en su claude_desktop_config.json :
Por ejemplo, su sección mcpServers podría verse así: