Escarcha MCP
Un servidor de Protocolo de Contexto de Modelo (MCP) que proporciona funciones de conversión de texto a voz mediante la API de Rime. Este servidor descarga audio y lo reproduce mediante el reproductor de audio nativo del sistema.
Características
- Expone una herramienta
speak
que convierte texto en voz y lo reproduce a través del audio del sistema. - Utiliza la API de síntesis de voz de alta calidad de Rime
Requisitos
- Node.js 16.x o superior
- Un dispositivo de salida de audio que funcione
- macOS: utiliza
afplay
Hay un código de muestra de Claude para lo siguiente que no está probado 🤙✨
- Windows: Media.SoundPlayer integrado (PowerShell)
- Linux: mpg123, mplayer, aplay o ffplay
Configuración de MCP
Todas las variables de entorno opcionales son parte de la definición de la herramienta y son indicaciones para
Aquí se enumeran todas las opciones de voz.
Puede obtener su clave API desde el panel de control de Rime .
Las siguientes variables de entorno se pueden utilizar para personalizar el comportamiento:
RIME_GUIDANCE
: La descripción principal de cuándo y cómo utilizar la herramienta de vozRIME_WHO_TO_ADDRESS
: A quién debe dirigirse el discurso (predeterminado: "usuario")RIME_WHEN_TO_SPEAK
: Cuándo se debe utilizar la herramienta (predeterminado: "cuando se le pide que hable o al finalizar un comando")RIME_VOICE
: La voz predeterminada a utilizar (predeterminada: "cove")
Ejemplos de casos de uso
Ejemplo 1: Anuncios del agente de codificación
Ejemplo 2: Aprende cómo hablan los niños hoy en día
Ejemplo 3: Diferentes idiomas según el contexto
Desarrollo
- Instalar dependencias:
- Construir el servidor:
- Ejecutar en modo de desarrollo con recarga en caliente:
Licencia
Instituto Tecnológico de Massachusetts (MIT)
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Tools
Un servidor de protocolo de contexto de modelo que permite a los modelos de IA generar y reproducir audio de texto a voz de alta calidad a través del sistema de audio nativo de su dispositivo utilizando la API de síntesis de voz de Rime.
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityFlicense-qualityA Model Context Protocol server that enables AI assistants to utilize AivisSpeech Engine's high-quality voice synthesis capabilities through a standardized API interface.Last updated -TypeScript
- -securityAlicense-qualityA server that enables Claude 3.7 and other AI agents to access VOICEVOX-compatible speech synthesis engines (AivisSpeech, VOICEVOX, COEIROINK) through the Model Context Protocol.Last updated -2TypeScriptMIT License
Gladia MCPofficial
-security-license-qualityOfficial Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.Last updated -PythonMIT License