Skip to main content
Glama

Kokoro TTS MCP Server

by giannisanni

Servidor MCP Kokoro TTS

Un servidor de Protocolo de Contexto de Modelo (MCP) que proporciona capacidades de conversión de texto a voz mediante el motor TTS de Kokoro. Este servidor expone la funcionalidad TTS mediante herramientas MCP, lo que facilita la integración de la síntesis de voz en sus aplicaciones.

Prerrequisitos

  • Python 3.10 o superior
  • administrador de paquetes uv

Instalación

  1. Primero, instale el administrador de paquetes uv :
curl -LsSf https://astral.sh/uv/install.sh | sh
  1. Clonar este repositorio e instalar las dependencias:
uv venv source .venv/bin/activate # On Windows, use: .venv\Scripts\activate uv pip install .

Características

  • Síntesis de texto a voz con voces personalizables
  • Velocidad de voz ajustable
  • Soporte para guardar audio en archivos o reproducción directa
  • Compatibilidad con reproducción de audio multiplataforma (Windows, macOS, Linux)

Uso

El servidor proporciona una única herramienta MCP generate_speech con los siguientes parámetros:

  • text (obligatorio): El texto que se convertirá a voz
  • voice (opcional): Voz que se utilizará para la síntesis (predeterminado: "af_heart")
  • speed (opcional): Multiplicador de velocidad del habla (predeterminado: 1.0)
  • save_path (opcional): Directorio para guardar archivos de audio
  • play_audio (opcional): si se debe reproducir el audio inmediatamente (predeterminado: Falso)

Ejemplo de uso

from mcp.client import Client async with Client() as client: await client.connect("kokoro-tts") # Generate and play speech result = await client.call_tool( "generate_speech", { "text": "Hello, world!", "voice": "af_heart", "speed": 1.0, "play_audio": True } )

Dependencias

  • kokoro >= 0.8.4
  • mcp[cli] >= 1.3.0
  • archivo de sonido >= 0.13.1

Soporte de plataforma

La reproducción de audio es compatible con:

  • Windows (usando start )
  • macOS (usando afplay )
  • Linux (usando aplay )

Configuración de MCP

Agregue la siguiente configuración a su archivo de configuración de MCP:

{ "mcpServers": { "kokoro-tts": { "command": "/Users/giannisan/pinokio/bin/miniconda/bin/uv", "args": [ "--directory", "/Users/giannisan/Documents/Cline/MCP/kokoro-tts-mcp", "run", "tts-mcp.py" ] } } }

Licencia

[Agregue la información de su licencia aquí]

-
security - not tested
F
license - not found
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Proporciona capacidades de conversión de texto a voz a través del Protocolo de contexto de modelo, lo que permite que las aplicaciones integren fácilmente la síntesis de voz con voces personalizables, velocidad de voz ajustable y soporte de reproducción de audio multiplataforma.

  1. Prerrequisitos
    1. Instalación
      1. Características
        1. Uso
          1. Ejemplo de uso
        2. Dependencias
          1. Soporte de plataforma
            1. Configuración de MCP
              1. Licencia

                Related MCP Servers

                • -
                  security
                  A
                  license
                  -
                  quality
                  A Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.
                  Last updated -
                  13
                  1
                  TypeScript
                  MIT License
                • -
                  security
                  F
                  license
                  -
                  quality
                  Enables seamless integration with Typecast API through the Model Context Protocol, allowing clients to manage voices, convert text to speech, and play audio in a standardized way.
                  Last updated -
                  2
                  Python
                • -
                  security
                  A
                  license
                  -
                  quality
                  Official Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.
                  Last updated -
                  2
                  Python
                  MIT License
                • -
                  security
                  A
                  license
                  -
                  quality
                  A Model Context Protocol server that enables developers to integrate advanced text-to-speech and video translation capabilities into their applications through simple API calls.
                  Last updated -
                  Python
                  MIT License

                View all related MCP servers

                MCP directory API

                We provide all the information about MCP servers via our MCP API.

                curl -X GET 'https://glama.ai/api/mcp/v1/servers/giannisanni/kokoro-tts-mcp'

                If you have feedback or need assistance with the MCP directory API, please join our Discord server