Skip to main content
Glama

Kokoro TTS MCP Server

by giannisanni

Servidor MCP Kokoro TTS

Un servidor de Protocolo de Contexto de Modelo (MCP) que proporciona capacidades de conversión de texto a voz mediante el motor TTS de Kokoro. Este servidor expone la funcionalidad TTS mediante herramientas MCP, lo que facilita la integración de la síntesis de voz en sus aplicaciones.

Prerrequisitos

  • Python 3.10 o superior
  • administrador de paquetes uv

Instalación

  1. Primero, instale el administrador de paquetes uv :
curl -LsSf https://astral.sh/uv/install.sh | sh
  1. Clonar este repositorio e instalar las dependencias:
uv venv source .venv/bin/activate # On Windows, use: .venv\Scripts\activate uv pip install .

Características

  • Síntesis de texto a voz con voces personalizables
  • Velocidad de voz ajustable
  • Soporte para guardar audio en archivos o reproducción directa
  • Compatibilidad con reproducción de audio multiplataforma (Windows, macOS, Linux)

Uso

El servidor proporciona una única herramienta MCP generate_speech con los siguientes parámetros:

  • text (obligatorio): El texto que se convertirá a voz
  • voice (opcional): Voz que se utilizará para la síntesis (predeterminado: "af_heart")
  • speed (opcional): Multiplicador de velocidad del habla (predeterminado: 1.0)
  • save_path (opcional): Directorio para guardar archivos de audio
  • play_audio (opcional): si se debe reproducir el audio inmediatamente (predeterminado: Falso)

Ejemplo de uso

from mcp.client import Client async with Client() as client: await client.connect("kokoro-tts") # Generate and play speech result = await client.call_tool( "generate_speech", { "text": "Hello, world!", "voice": "af_heart", "speed": 1.0, "play_audio": True } )

Dependencias

  • kokoro >= 0.8.4
  • mcp[cli] >= 1.3.0
  • archivo de sonido >= 0.13.1

Soporte de plataforma

La reproducción de audio es compatible con:

  • Windows (usando start )
  • macOS (usando afplay )
  • Linux (usando aplay )

Configuración de MCP

Agregue la siguiente configuración a su archivo de configuración de MCP:

{ "mcpServers": { "kokoro-tts": { "command": "/Users/giannisan/pinokio/bin/miniconda/bin/uv", "args": [ "--directory", "/Users/giannisan/Documents/Cline/MCP/kokoro-tts-mcp", "run", "tts-mcp.py" ] } } }

Licencia

[Agregue la información de su licencia aquí]

-
security - not tested
F
license - not found
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Proporciona capacidades de conversión de texto a voz a través del Protocolo de contexto de modelo, lo que permite que las aplicaciones integren fácilmente la síntesis de voz con voces personalizables, velocidad de voz ajustable y soporte de reproducción de audio multiplataforma.

  1. Prerrequisitos
    1. Instalación
      1. Características
        1. Uso
          1. Ejemplo de uso
        2. Dependencias
          1. Soporte de plataforma
            1. Configuración de MCP
              1. Licencia

                Related MCP Servers

                • -
                  security
                  F
                  license
                  -
                  quality
                  Integrates ElevenLabs Text-to-Speech capabilities with Cursor through the Model Context Protocol, allowing users to convert text to speech with selectable voices within the Cursor editor.
                  Last updated -
                  1
                  Python
                  • Linux
                  • Apple
                • -
                  security
                  F
                  license
                  -
                  quality
                  A Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.
                  Last updated -
                  239
                  JavaScript
                  • Apple
                  • Linux
                • -
                  security
                  F
                  license
                  -
                  quality
                  A Model Context Protocol server that enables AI assistants to utilize AivisSpeech Engine's high-quality voice synthesis capabilities through a standardized API interface.
                  Last updated -
                  TypeScript
                • -
                  security
                  A
                  license
                  -
                  quality
                  A Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.
                  Last updated -
                  TypeScript
                  MIT License

                View all related MCP servers

                MCP directory API

                We provide all the information about MCP servers via our MCP API.

                curl -X GET 'https://glama.ai/api/mcp/v1/servers/giannisanni/kokoro-tts-mcp'

                If you have feedback or need assistance with the MCP directory API, please join our Discord server