Servidor MCP de voz
Un servidor de protocolo de contexto de modelo que proporciona capacidades de conversión de texto a voz utilizando el modelo Kokoro TTS.
Configuración
El servidor se puede configurar utilizando las siguientes variables de entorno:
Variable | Descripción | Por defecto | Rango válido |
| Multiplicador de velocidad predeterminado para texto a voz | 1.1 | 0,5 a 2,0 |
En el cursor:
{
"mcpServers": {
"speech": {
"command": "npx",
"args": [
"-y",
"speech-mcp-server"
],
"env": {
MCP_DEFAULT_SPEECH_SPEED: 1.3
}
}
}
}Related MCP server: TTS-MCP
Características
🎯 Texto a voz de alta calidad con el modelo Kokoro TTS
🗣️ Múltiples opciones de voz disponibles
🎛️ Parámetros de voz personalizables (voz, velocidad)
🔌 Interfaz compatible con MCP
📦 Fácil instalación y configuración
🚀 No se requiere clave API
Instalación
# Using npm
npm install speech-mcp-server
# Using pnpm (recommended)
pnpm add speech-mcp-server
# Using yarn
yarn add speech-mcp-serverUso
Ejecutar el servidor:
# Using default configuration
npm start
# With custom speech speed
MCP_DEFAULT_SPEECH_SPEED=1.5 npm startEl servidor proporciona las siguientes herramientas MCP:
text_to_speech: Conversión básica de texto a voztext_to_speech_with_options: Conversión de texto a voz con velocidad personalizablelist_voices: Lista todas las voces disponiblesget_model_status: verifica el estado de inicialización del modelo TTS
Desarrollo
# Clone the repository
git clone <your-repo-url>
cd speech-mcp-server
# Install dependencies
pnpm install
# Start development server with auto-reload
pnpm dev
# Build the project
pnpm build
# Run linting
pnpm lint
# Format code
pnpm format
# Test with MCP Inspector
pnpm inspectorHerramientas disponibles
1. texto a voz
Convierte texto en voz utilizando la configuración predeterminada.
{
"type": "request",
"id": "1",
"method": "call_tool",
"params": {
"name": "text_to_speech",
"arguments": {
"text": "Hello world",
"voice": "af_bella" // optional
}
}
}2. texto a voz con opciones
Convierte texto en voz con parámetros personalizables.
{
"type": "request",
"id": "1",
"method": "call_tool",
"params": {
"name": "text_to_speech_with_options",
"arguments": {
"text": "Hello world",
"voice": "af_bella", // optional
"speed": 1.0, // optional (0.5 to 2.0)
}
}
}3. lista_voces
Enumera todas las voces disponibles para la conversión de texto a voz.
{
"type": "request",
"id": "1",
"method": "list_voices",
"params": {}
}4. obtener_estado_del_modelo
Verifique el estado actual de la inicialización del modelo TTS. Esto es especialmente útil al iniciar el servidor por primera vez, ya que es necesario descargar e inicializar el modelo.
{
"type": "request",
"id": "1",
"method": "call_tool",
"params": {
"name": "get_model_status",
"arguments": {}
}
}Ejemplo de respuesta:
{
"content": [{
"type": "text",
"text": "Model status: initializing (5s elapsed)"
}]
}Posibles valores de estado:
uninitialized: la inicialización del modelo no ha comenzadoinitializing: el modelo se está descargando e inicializandoready: El modelo está listo para usar.error: Se produjo un error durante la inicialización
Pruebas
Puede probar el servidor utilizando el Inspector MCP o enviando mensajes JSON sin procesar:
# List available tools
echo '{"type":"request","id":"1","method":"list_tools","params":{}}' | node dist/index.js
# List available voices
echo '{"type":"request","id":"2","method":"list_voices","params":{}}' | node dist/index.js
# Convert text to speech
echo '{"type":"request","id":"3","method":"call_tool","params":{"name":"text_to_speech","arguments":{"text":"Hello world","voice":"af_bella"}}}' | node dist/index.jsIntegración con Claude Desktop
Para utilizar este servidor con Claude Desktop, agregue lo siguiente a su archivo de configuración de Claude Desktop ( ~/Library/Application Support/Claude/claude_desktop_config.json ):
{
"servers": {
"speech": {
"command": "npx",
"args": ["@decodershq/speech-mcp-server"]
}
}
}Contribuyendo
¡Agradecemos sus contribuciones! No dude en enviar una solicitud de incorporación de cambios.
Licencia
Licencia MIT: consulte el archivo LICENCIA para obtener más detalles.
Solución de problemas
Problemas de inicialización del modelo
El servidor intenta descargar e inicializar automáticamente el modelo TTS al iniciarse. Si se producen errores de inicialización:
El servidor lo intentará nuevamente automáticamente hasta 3 veces con una limpieza entre intentos.
Utilice la herramienta
get_model_statuspara supervisar el progreso de la inicialización y cualquier errorSi la inicialización falla después de todos los reintentos, intente eliminar manualmente los archivos del modelo:
# Remove model files (MacOS/Linux)
rm -rf ~/.npm/_npx/**/node_modules/@huggingface/transformers/.cache/onnx-community/Kokoro-82M-v1.0-ONNX/onnx/model_quantized.onnx
rm -rf ~/.cache/huggingface/transformers/onnx-community/Kokoro-82M-v1.0-ONNX/onnx/model_quantized.onnx
# Then restart the server
npm startLa herramienta get_model_status ahora incluirá información de reintento en su respuesta:
{
"content": [{
"type": "text",
"text": "Model status: initializing (5s elapsed, retry 1/3)"
}]
}Resources
Looking for Admin?
Admins can modify the Dockerfile, update the server description, and track usage metrics. If you are the server author, to authenticate as an admin.
Appeared in Searches
- A platform providing TTS (Text-to-Speech) capabilities
- A service to convert text to ready-to-use audio with download, player, or embed options
- Using Hugging Face for Text-to-Audio, Image, and Video Generation
- A search for translation services or tools
- A system for retrieving medical knowledge, especially in medical imaging, and generating reports