Skip to main content
Glama

Interactive Voice MCP Server

by rungee84

Servidor de voz interactiva MCP (Kokoro TTS + NeMo ASR)

Un servidor de protocolo de contexto de modelo que proporciona capacidades de texto a voz (TTS) mediante Kokoro y capacidades de voz a texto (STT) mediante modelos NVIDIA NeMo Parakeet, lo que permite diálogos de voz interactivos.

Herramientas disponibles

  • interactive_voice_dialog : sintetiza texto a voz, lo reproduce, luego escucha la entrada de voz del usuario y devuelve la transcripción.
    • Argumentos obligatorios:
      • text_to_speak (cadena): El texto que el asistente debe decir.
    • Argumentos opcionales:
      • voice (cadena): La voz que se usará para TTS (p. ej., 'af_heart'). El valor predeterminado es 'af_heart'.

Instalación

Prerrequisitos

Algunos de los modelos TTS subyacentes requieren que espeak-ng esté instalado en su sistema.

Instalación de Windows:

  1. Vaya a los lanzamientos de espeak-ng .
  2. Haga clic en "Último lanzamiento".
  3. Descargue el archivo *.msi apropiado (por ejemplo espeak-ng-20191129-b702b03-x64.msi ).
  4. Ejecute el instalador descargado.

Instalación de Desarrollo Local

Para que Claude Desktop pueda iniciar este servidor con python -m mcp_server_tts , debe instalarlo como módulo de Python. Se recomienda instalarlo en modo "editable" ( -e ) para desarrollo, ya que los cambios en el código fuente se reflejan inmediatamente sin necesidad de reinstalar.

Navegue al directorio que contiene el archivo pyproject.toml (la raíz de este proyecto de servidor) y ejecute:

pip install -e .

Después de la instalación, puedes ejecutarlo como un script usando:

python -m mcp_server_tts.server # Assuming the main module is still server.py within mcp_server_tts # Or, if you create a new package structure: # python -m mcp_interactive_voice_server

Configuración

Para usar este servidor con Claude Desktop, debe agregarlo a su archivo claude_desktop_config.json . La ubicación de este archivo suele ser: C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.json

Agregue la siguiente entrada bajo el objeto mcpServers en su claude_desktop_config.json :

"tts": { "command": "python", "args": ["-m", "mcp_server_tts"] }

Por ejemplo, su sección mcpServers podría verse así:

{ // ... other configurations ... "mcpServers": { // ... other servers ... "tts": { "command": "python", "args": ["-m", "mcp_server_tts"] } // ... other servers ... } // ... other configurations ... }
-
security - not tested
F
license - not found
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Permite interacciones basadas en voz con Claude convirtiendo texto en voz usando Kokoro TTS y transcribiendo las respuestas del usuario usando NVIDIA NeMo ASR, creando diálogos de voz interactivos.

  1. Herramientas disponibles
    1. Instalación
      1. Prerrequisitos
      2. Instalación de Desarrollo Local
    2. Configuración

      Related MCP Servers

      • -
        security
        A
        license
        -
        quality
        Lets you use Claude Desktop, or any MCP Client, to use natural language to accomplish things with Neon.
        Last updated -
        600
        306
        TypeScript
        MIT License
        • Linux
        • Apple
      • A
        security
        F
        license
        A
        quality
        Facilitates direct speech generation using Claude for multiple languages and emotions, integrating with a Zonos TTS setup via the Model Context Protocol.
        Last updated -
        1
        9
        TypeScript
        • Linux
      • -
        security
        F
        license
        -
        quality
        Provides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.
        Last updated -
        2
        Python
      • -
        security
        A
        license
        -
        quality
        Enables Claude and other AI assistants to interact with your computer's audio system, allowing for recording from microphones and playing audio through speakers.
        Last updated -
        2
        Python
        MIT License
        • Linux
        • Apple

      View all related MCP servers

      MCP directory API

      We provide all the information about MCP servers via our MCP API.

      curl -X GET 'https://glama.ai/api/mcp/v1/servers/rungee84/voice_mcp'

      If you have feedback or need assistance with the MCP directory API, please join our Discord server