Servidor de voz interactiva MCP (Kokoro TTS + NeMo ASR)
Un servidor de protocolo de contexto de modelo que proporciona capacidades de texto a voz (TTS) mediante Kokoro y capacidades de voz a texto (STT) mediante modelos NVIDIA NeMo Parakeet, lo que permite diálogos de voz interactivos.
Herramientas disponibles
interactive_voice_dialog
: sintetiza texto a voz, lo reproduce, luego escucha la entrada de voz del usuario y devuelve la transcripción.- Argumentos obligatorios:
text_to_speak
(cadena): El texto que el asistente debe decir.
- Argumentos opcionales:
voice
(cadena): La voz que se usará para TTS (p. ej., 'af_heart'). El valor predeterminado es 'af_heart'.
- Argumentos obligatorios:
Instalación
Prerrequisitos
Algunos de los modelos TTS subyacentes requieren que espeak-ng
esté instalado en su sistema.
Instalación de Windows:
- Vaya a los lanzamientos de espeak-ng .
- Haga clic en "Último lanzamiento".
- Descargue el archivo
*.msi
apropiado (por ejemploespeak-ng-20191129-b702b03-x64.msi
). - Ejecute el instalador descargado.
Instalación de Desarrollo Local
Para que Claude Desktop pueda iniciar este servidor con python -m mcp_server_tts
, debe instalarlo como módulo de Python. Se recomienda instalarlo en modo "editable" ( -e
) para desarrollo, ya que los cambios en el código fuente se reflejan inmediatamente sin necesidad de reinstalar.
Navegue al directorio que contiene el archivo pyproject.toml
(la raíz de este proyecto de servidor) y ejecute:
Después de la instalación, puedes ejecutarlo como un script usando:
Configuración
Para usar este servidor con Claude Desktop, debe agregarlo a su archivo claude_desktop_config.json
. La ubicación de este archivo suele ser: C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.json
Agregue la siguiente entrada bajo el objeto mcpServers
en su claude_desktop_config.json
:
Por ejemplo, su sección mcpServers
podría verse así:
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Permite interacciones basadas en voz con Claude convirtiendo texto en voz usando Kokoro TTS y transcribiendo las respuestas del usuario usando NVIDIA NeMo ASR, creando diálogos de voz interactivos.
Related MCP Servers
- -securityAlicense-qualityLets you use Claude Desktop, or any MCP Client, to use natural language to accomplish things with Neon.Last updated -600306TypeScriptMIT License
- AsecurityFlicenseAqualityFacilitates direct speech generation using Claude for multiple languages and emotions, integrating with a Zonos TTS setup via the Model Context Protocol.Last updated -19TypeScript
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityAlicense-qualityEnables Claude and other AI assistants to interact with your computer's audio system, allowing for recording from microphones and playing audio through speakers.Last updated -2PythonMIT License