Servidor MCP de voz
Un servidor de protocolo de contexto de modelo que proporciona capacidades de conversión de texto a voz utilizando el modelo Kokoro TTS.
Configuración
El servidor se puede configurar utilizando las siguientes variables de entorno:
Variable | Descripción | Por defecto | Rango válido |
---|---|---|---|
MCP_DEFAULT_SPEECH_SPEED | Multiplicador de velocidad predeterminado para texto a voz | 1.1 | 0,5 a 2,0 |
En el cursor:
Características
- 🎯 Texto a voz de alta calidad con el modelo Kokoro TTS
- 🗣️ Múltiples opciones de voz disponibles
- 🎛️ Parámetros de voz personalizables (voz, velocidad)
- 🔌 Interfaz compatible con MCP
- 📦 Fácil instalación y configuración
- 🚀 No se requiere clave API
Instalación
Uso
Ejecutar el servidor:
El servidor proporciona las siguientes herramientas MCP:
text_to_speech
: Conversión básica de texto a voztext_to_speech_with_options
: Conversión de texto a voz con velocidad personalizablelist_voices
: Lista todas las voces disponiblesget_model_status
: verifica el estado de inicialización del modelo TTS
Desarrollo
Herramientas disponibles
1. texto a voz
Convierte texto en voz utilizando la configuración predeterminada.
2. texto a voz con opciones
Convierte texto en voz con parámetros personalizables.
3. lista_voces
Enumera todas las voces disponibles para la conversión de texto a voz.
4. obtener_estado_del_modelo
Verifique el estado actual de la inicialización del modelo TTS. Esto es especialmente útil al iniciar el servidor por primera vez, ya que es necesario descargar e inicializar el modelo.
Ejemplo de respuesta:
Posibles valores de estado:
uninitialized
: la inicialización del modelo no ha comenzadoinitializing
: el modelo se está descargando e inicializandoready
: El modelo está listo para usar.error
: Se produjo un error durante la inicialización
Pruebas
Puede probar el servidor utilizando el Inspector MCP o enviando mensajes JSON sin procesar:
Integración con Claude Desktop
Para utilizar este servidor con Claude Desktop, agregue lo siguiente a su archivo de configuración de Claude Desktop ( ~/Library/Application Support/Claude/claude_desktop_config.json
):
Contribuyendo
¡Agradecemos sus contribuciones! No dude en enviar una solicitud de incorporación de cambios.
Licencia
Licencia MIT: consulte el archivo LICENCIA para obtener más detalles.
Solución de problemas
Problemas de inicialización del modelo
El servidor intenta descargar e inicializar automáticamente el modelo TTS al iniciarse. Si se producen errores de inicialización:
- El servidor lo intentará nuevamente automáticamente hasta 3 veces con una limpieza entre intentos.
- Utilice la herramienta
get_model_status
para supervisar el progreso de la inicialización y cualquier error - Si la inicialización falla después de todos los reintentos, intente eliminar manualmente los archivos del modelo:
La herramienta get_model_status
ahora incluirá información de reintento en su respuesta:
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Un servidor de protocolo de contexto de modelo que proporciona capacidades de conversión de texto a voz utilizando el modelo Kokoro TTS, ofreciendo múltiples opciones de voz y parámetros de voz personalizables.
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
- -securityAlicense-qualityA Model Context Protocol server that enables AI models to interact with VoIPBin's VoIP services, supporting features like call management, agent management, campaigns, conferences, and chat functionality.Last updated -2PythonMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -1154JavaScriptThe Unlicense
Appeared in Searches
- A service to convert text to ready-to-use audio with download, player, or embed options
- Using Hugging Face for Text-to-Audio, Image, and Video Generation
- A search for translation services or tools
- A system for retrieving medical knowledge, especially in medical imaging, and generating reports
- Creating an AI Chatbot for a Shopify Store