Skip to main content
Glama

TTS-MCP

by nakamurau1

tts-mcp

Un servidor de Protocolo de Contexto de Modelo (MCP) y una herramienta de línea de comandos para la generación de texto a voz de alta calidad utilizando la API TTS de OpenAI.

Características principales

  • Servidor MCP : integre capacidades de texto a voz con Claude Desktop y otros clientes compatibles con MCP
  • Opciones de voz : Soporte para múltiples personajes de voz (alloy, nova, echo, etc.)
  • Audio de alta calidad : Compatibilidad con varios formatos de salida (MP3, WAV, OPUS, AAC)
  • Personalizable : configure la velocidad del habla, el carácter de la voz y las instrucciones adicionales
  • Herramienta CLI : También disponible como utilidad de línea de comandos para la conversión directa de texto a voz

Instalación

Método 1: Instalar desde el repositorio

# Clone the repository git clone https://github.com/nakamurau1/tts-mcp.git cd tts-mcp # Install dependencies npm install # Optional: Install globally npm install -g .

Método 2: Ejecutar directamente con npx (no requiere instalación)

# Start the MCP server directly npx tts-mcp tts-mcp-server --voice nova --model tts-1-hd # Use the CLI tool directly npx tts-mcp -t "Hello, world" -o hello.mp3

Uso del servidor MCP

El servidor MCP le permite integrar la funcionalidad de texto a voz con clientes compatibles con el Protocolo de contexto de modelo (MCP) como Claude Desktop.

Iniciar el servidor MCP

# Start with default settings npm run server # Start with custom settings npm run server -- --voice nova --model tts-1-hd # Or directly with API key node bin/tts-mcp-server.js --voice echo --api-key your-openai-api-key

Opciones del servidor MCP

Options: -V, --version Display version information -m, --model <model> TTS model to use (default: "gpt-4o-mini-tts") -v, --voice <voice> Voice character (default: "alloy") -f, --format <format> Audio format (default: "mp3") --api-key <key> OpenAI API key (can also be set via environment variable) -h, --help Display help information

Integración con clientes MCP

El servidor MCP se puede utilizar con Claude Desktop y otros clientes compatibles con MCP. Para la integración con Claude Desktop:

  1. Abra el archivo de configuración de Claude Desktop (normalmente en ~/Library/Application Support/Claude/claude_desktop_config.json )
  2. Agregue la siguiente configuración, incluida su clave API de OpenAI:
{ "mcpServers": { "tts-mcp": { "command": "node", "args": ["full/path/to/bin/tts-mcp-server.js", "--voice", "nova", "--api-key", "your-openai-api-key"], "env": { "OPENAI_API_KEY": "your-openai-api-key" } } } }

Alternativamente, puede utilizar npx para una configuración más sencilla:

{ "mcpServers": { "tts-mcp": { "command": "npx", "args": ["-p", "tts-mcp", "tts-mcp-server", "--voice", "nova", "--model", "gpt-4o-mini-tts"], "env": { "OPENAI_API_KEY": "your-openai-api-key" } } } }

Puede proporcionar la clave API de dos maneras:

  1. Método directo (recomendado para pruebas): Inclúyalo en la matriz args usando el parámetro --api-key
  2. Método de variable de entorno (más seguro): configúrelo en el objeto env como se muestra arriba

Nota de seguridad : asegúrese de proteger su archivo de configuración al incluir claves API.

  1. Reiniciar Claude Desktop
  2. Cuando le pides a Claude que "lea este texto en voz alta" o solicitudes similares, el texto se convertirá en voz.

Herramientas MCP disponibles

  • texto a voz : herramienta para convertir texto a voz y reproducirlo

Uso de la herramienta CLI

También puede utilizar tts-mcp como una herramienta de línea de comandos independiente:

# Convert text directly tts-mcp -t "Hello, world" -o hello.mp3 # Convert from a text file tts-mcp -f speech.txt -o speech.mp3 # Specify custom voice tts-mcp -t "Welcome to the future" -o welcome.mp3 -v nova

Opciones de la herramienta CLI

Options: -V, --version Display version information -t, --text <text> Text to convert -f, --file <path> Path to input text file -o, --output <path> Path to output audio file (required) -m, --model <n> Model to use (default: "gpt-4o-mini-tts") -v, --voice <n> Voice character (default: "alloy") -s, --speed <number> Speech speed (0.25-4.0) (default: 1) --format <format> Output format (default: "mp3") -i, --instructions <text> Additional instructions for speech generation --api-key <key> OpenAI API key (can also be set via environment variable) -h, --help Display help information

Voces compatibles

Se admiten los siguientes caracteres de voz:

  • aleación (predeterminado)
  • ceniza
  • coral
  • eco
  • fábula
  • ónix
  • estrella nueva
  • sabio
  • brillar

Modelos compatibles

  • tts-1
  • tts-1-hd
  • gpt-4o-mini-tts (predeterminado)

Formatos de salida

Se admiten los siguientes formatos de salida:

  • mp3 (predeterminado)
  • opus
  • aac
  • flac
  • onda
  • PCM

Variables de entorno

También puede configurar la herramienta utilizando variables de entorno del sistema:

OPENAI_API_KEY=your-api-key-here

Licencia

Instituto Tecnológico de Massachusetts (MIT)

-
security - not tested
A
license - permissive license
-
quality - not tested

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Un servidor de protocolo de contexto de modelo que integra capacidades de conversión de texto a voz de alta calidad con Claude Desktop y otros clientes compatibles con MCP, admitiendo múltiples opciones de voz y formatos de audio.

  1. Características principales
    1. Instalación
      1. Método 1: Instalar desde el repositorio
      2. Método 2: Ejecutar directamente con npx (no requiere instalación)
    2. Uso del servidor MCP
      1. Iniciar el servidor MCP
      2. Opciones del servidor MCP
      3. Integración con clientes MCP
      4. Herramientas MCP disponibles
    3. Uso de la herramienta CLI
      1. Opciones de la herramienta CLI
    4. Voces compatibles
      1. Modelos compatibles
        1. Formatos de salida
          1. Variables de entorno
            1. Licencia

              Related MCP Servers

              • -
                security
                F
                license
                -
                quality
                Provides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.
                Last updated -
                2
                Python
              • -
                security
                F
                license
                -
                quality
                A Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.
                Last updated -
                239
                JavaScript
                • Apple
                • Linux
              • A
                security
                A
                license
                A
                quality
                An official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.
                Last updated -
                19
                700
                Python
                MIT License
                • Apple
              • -
                security
                -
                license
                -
                quality
                Official Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.
                Last updated -
                Python
                MIT License

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/nakamurau1/tts-mcp'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server