Skip to main content
Glama

Kokoro Text to Speech MCP Server

by mberg

Kokoro テキスト読み上げ (TTS) MCP サーバー

S3 にアップロードするオプションを備えた .mp3 ファイルを生成する Kokoro Text to Speech MCP サーバー。

使用場所: https://huggingface.co/spaces/hexgrad/Kokoro-TTS

構成

MCP 設定に以下を追加してください。ご自身の値に更新してください。

"kokoro-tts-mcp": { "command": "uv", "args": [ "--directory", "/path/toyourlocal/kokoro-tts-mcp", "run", "mcp-tts.py" ], "env": { "TTS_VOICE": "af_heart", "TTS_SPEED": "1.0", "TTS_LANGUAGE": "en-us", "AWS_ACCESS_KEY_ID": "", "AWS_SECRET_ACCESS_KEY": "", "AWS_REGION": "us-east-1", "AWS_S3_FOLDER": "mp3", "S3_ENABLED": "true", "MP3_FOLDER": "/path/to/mp3" } }

ffmmegをインストールする

これは.wavファイルを.mp3ファイルに変換するために必要です

Macの場合:

brew install ffmpeg

ローカルで実行するには、これらを.envファイルに追加してください。env.exampleを参照し、.envにコピーして、ご自身の値に変更してください。

サポートされている環境変数

  • AWS_ACCESS_KEY_ID : AWSアクセスキーID
  • AWS_SECRET_ACCESS_KEY : AWSシークレットアクセスキー
  • AWS_S3_BUCKET_NAME : S3バケット名
  • AWS_S3_REGION : S3リージョン(例:us-east-1)
  • AWS_S3_FOLDER : S3バケット内のフォルダパス
  • AWS_S3_ENDPOINT_URL : S3互換ストレージのオプションのカスタムエンドポイントURL
  • MCP_HOST : サーバーをバインドするホスト (デフォルト: 0.0.0.0)
  • MCP_PORT : リッスンするポート (デフォルト: 9876)
  • MCP_CLIENT_HOST : サーバーへのクライアント接続のホスト名 (デフォルト: localhost)
  • DEBUG : デバッグモードを有効にする(「true」または「1」に設定)
  • S3_ENABLED : S3アップロードを有効にする(「true」または「1」に設定)
  • MP3_FOLDER : MP3ファイルを保存するパス(デフォルトはスクリプトディレクトリ内の「mp3」フォルダ)
  • MP3_RETENTION_DAYS : MP3ファイルを自動的に削除するまで保存する日数
  • DELETE_LOCAL_AFTER_S3_UPLOAD : S3アップロードが成功した後にローカルのMP3ファイルを削除するかどうか(「true」または「1」に設定)
  • TTS_VOICE : TTSクライアントのデフォルトの音声(デフォルト: af_heart)
  • TTS_SPEED : TTSクライアントのデフォルト速度(デフォルト: 1.0)
  • TTS_LANGUAGE : TTSクライアントのデフォルト言語(デフォルト: en-us)

ローカルでサーバーを実行する

推奨される方法はUVを使用する

uv run mcp-tts.py

TTSクライアントの使用

mcp_client.pyスクリプトを使用すると、TTS リクエストをサーバーに送信できます。使い方は以下です。

接続設定

サーバーとクライアントを同じマシン上で実行する場合:

  • サーバーは0.0.0.0 (すべてのインターフェース) または127.0.0.1 (ローカルホストのみ) にバインドする必要があります
  • クライアントはlocalhostまたは127.0.0.1に接続する必要があります

基本的な使い方

python mcp_client.py --text "Hello, world!"

ファイルからテキストを読み込む

python mcp_client.py --file my_text.txt

音声と速度のカスタマイズ

python mcp_client.py --text "Hello, world!" --voice "en_female" --speed 1.2

S3アップロードを無効にする

python mcp_client.py --text "Hello, world!" --no-s3

コマンドラインオプション

python mcp_client.py --help

MP3ファイル管理

TTSサーバーはMP3ファイルを生成し、ローカルに保存するか、オプションでS3にアップロードします。これらのファイルの管理方法を設定できます。

ローカルストレージ

  • .envファイルでMP3_FOLDERを設定して、MP3ファイルが保存される場所を指定します。
  • ファイルは自動的に削除されない限りこのフォルダに保存されます

自動クリーンアップ

  • MP3_RETENTION_DAYS=30 (または任意の数字)を設定すると、その日数より古いファイルが自動的に削除されます。
  • DELETE_LOCAL_AFTER_S3_UPLOAD=trueを設定すると、S3 アップロードが成功した直後にローカルファイルを削除します。

S3統合

  • S3_ENABLED=trueまたはDISABLE_S3=trueで S3 アップロードを有効/無効にする
  • .envファイルで AWS 認証情報とバケット設定を構成する
  • S3アップロードはクライアントの--no-s3オプションを使用してリクエストごとに無効にすることができます。
-
security - not tested
A
license - permissive license
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

オプションの S3 アップロード機能を備えた Kokoro TTS テクノロジーを使用してテキストから MP3 オーディオ ファイルを生成するサーバー。

  1. 構成
    1. ffmmegをインストールする
    2. サポートされている環境変数
  2. ローカルでサーバーを実行する
    1. TTSクライアントの使用
      1. 接続設定
      2. 基本的な使い方
      3. ファイルからテキストを読み込む
      4. 音声と速度のカスタマイズ
      5. S3アップロードを無効にする
      6. コマンドラインオプション
    2. MP3ファイル管理
      1. ローカルストレージ
      2. 自動クリーンアップ
      3. S3統合

    Related MCP Servers

    • -
      security
      F
      license
      -
      quality
      A server providing text-to-speech and speech-to-text functionalities using Windows' native speech services without external dependencies.
      Last updated -
      4
      JavaScript
    • A
      security
      A
      license
      A
      quality
      A server enabling integration between KoboldAI's text generation capabilities and MCP-compatible applications, with features like chat completion, Stable Diffusion, and OpenAI-compatible API endpoints.
      Last updated -
      20
      5
      3
      JavaScript
      MIT License
    • -
      security
      F
      license
      -
      quality
      A Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.
      Last updated -
      239
      JavaScript
      • Apple
      • Linux
    • A
      security
      A
      license
      A
      quality
      A MCP server that enables transcription of audio files using OpenAI's Speech-to-Text API, with support for multiple languages and file saving options.
      Last updated -
      1
      2
      JavaScript
      MIT License
      • Linux
      • Apple

    View all related MCP servers

    MCP directory API

    We provide all the information about MCP servers via our MCP API.

    curl -X GET 'https://glama.ai/api/mcp/v1/servers/mberg/kokoro-tts-mcp'

    If you have feedback or need assistance with the MCP directory API, please join our Discord server