tts-mcp
Un servidor de Protocolo de Contexto de Modelo (MCP) y una herramienta de línea de comandos para la generación de texto a voz de alta calidad utilizando la API TTS de OpenAI.
Características principales
- Servidor MCP : integre capacidades de texto a voz con Claude Desktop y otros clientes compatibles con MCP
- Opciones de voz : Soporte para múltiples personajes de voz (alloy, nova, echo, etc.)
- Audio de alta calidad : Compatibilidad con varios formatos de salida (MP3, WAV, OPUS, AAC)
- Personalizable : configure la velocidad del habla, el carácter de la voz y las instrucciones adicionales
- Herramienta CLI : También disponible como utilidad de línea de comandos para la conversión directa de texto a voz
Instalación
Método 1: Instalar desde el repositorio
Método 2: Ejecutar directamente con npx (no requiere instalación)
Uso del servidor MCP
El servidor MCP le permite integrar la funcionalidad de texto a voz con clientes compatibles con el Protocolo de contexto de modelo (MCP) como Claude Desktop.
Iniciar el servidor MCP
Opciones del servidor MCP
Integración con clientes MCP
El servidor MCP se puede utilizar con Claude Desktop y otros clientes compatibles con MCP. Para la integración con Claude Desktop:
- Abra el archivo de configuración de Claude Desktop (normalmente en
~/Library/Application Support/Claude/claude_desktop_config.json
) - Agregue la siguiente configuración, incluida su clave API de OpenAI:
Alternativamente, puede utilizar npx para una configuración más sencilla:
Puede proporcionar la clave API de dos maneras:
- Método directo (recomendado para pruebas): Inclúyalo en la matriz
args
usando el parámetro--api-key
- Método de variable de entorno (más seguro): configúrelo en el objeto
env
como se muestra arriba
Nota de seguridad : asegúrese de proteger su archivo de configuración al incluir claves API.
- Reiniciar Claude Desktop
- Cuando le pides a Claude que "lea este texto en voz alta" o solicitudes similares, el texto se convertirá en voz.
Herramientas MCP disponibles
- texto a voz : herramienta para convertir texto a voz y reproducirlo
Uso de la herramienta CLI
También puede utilizar tts-mcp como una herramienta de línea de comandos independiente:
Opciones de la herramienta CLI
Voces compatibles
Se admiten los siguientes caracteres de voz:
- aleación (predeterminado)
- ceniza
- coral
- eco
- fábula
- ónix
- estrella nueva
- sabio
- brillar
Modelos compatibles
- tts-1
- tts-1-hd
- gpt-4o-mini-tts (predeterminado)
Formatos de salida
Se admiten los siguientes formatos de salida:
- mp3 (predeterminado)
- opus
- aac
- flac
- onda
- PCM
Variables de entorno
También puede configurar la herramienta utilizando variables de entorno del sistema:
Licencia
Instituto Tecnológico de Massachusetts (MIT)
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Un servidor de protocolo de contexto de modelo que integra capacidades de conversión de texto a voz de alta calidad con Claude Desktop y otros clientes compatibles con MCP, admitiendo múltiples opciones de voz y formatos de audio.
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityFlicense-qualityA Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.Last updated -239JavaScript
ElevenLabs MCP Serverofficial
AsecurityAlicenseAqualityAn official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.Last updated -19700PythonMIT LicenseGladia MCPofficial
-security-license-qualityOfficial Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.Last updated -PythonMIT License