Escarcha MCP
Un servidor de Protocolo de Contexto de Modelo (MCP) que proporciona funciones de conversión de texto a voz mediante la API de Rime. Este servidor descarga audio y lo reproduce mediante el reproductor de audio nativo del sistema.
Características
- Expone una herramienta
speak
que convierte texto en voz y lo reproduce a través del audio del sistema. - Utiliza la API de síntesis de voz de alta calidad de Rime
Requisitos
- Node.js 16.x o superior
- Un dispositivo de salida de audio que funcione
- macOS: utiliza
afplay
Hay un código de muestra de Claude para lo siguiente que no está probado 🤙✨
- Windows: Media.SoundPlayer integrado (PowerShell)
- Linux: mpg123, mplayer, aplay o ffplay
Configuración de MCP
Todas las variables de entorno opcionales son parte de la definición de la herramienta y son indicaciones para
Aquí se enumeran todas las opciones de voz.
Puede obtener su clave API desde el panel de control de Rime .
Las siguientes variables de entorno se pueden utilizar para personalizar el comportamiento:
RIME_GUIDANCE
: La descripción principal de cuándo y cómo utilizar la herramienta de vozRIME_WHO_TO_ADDRESS
: A quién debe dirigirse el discurso (predeterminado: "usuario")RIME_WHEN_TO_SPEAK
: Cuándo se debe utilizar la herramienta (predeterminado: "cuando se le pide que hable o al finalizar un comando")RIME_VOICE
: La voz predeterminada a utilizar (predeterminada: "cove")
Ejemplos de casos de uso
Ejemplo 1: Anuncios del agente de codificación
Ejemplo 2: Aprende cómo hablan los niños hoy en día
Ejemplo 3: Diferentes idiomas según el contexto
Desarrollo
- Instalar dependencias:
- Construir el servidor:
- Ejecutar en modo de desarrollo con recarga en caliente:
Licencia
Instituto Tecnológico de Massachusetts (MIT)
This server cannot be installed
Un servidor de protocolo de contexto de modelo que permite a los modelos de IA generar y reproducir audio de texto a voz de alta calidad a través del sistema de audio nativo de su dispositivo utilizando la API de síntesis de voz de Rime.