Kokoro Text to Speech MCP Server

Apache 2.0
  • Apple

Integrations

  • Manages configuration through environment variables stored in .env files for customizing TTS settings and service connections.

  • Converts generated .wav audio files to .mp3 format for storage and distribution.

  • Provides access to the Kokoro ONNX weights repository for downloading necessary model files.

Kokoro テキスト読み上げ (TTS) MCP サーバー

S3 にアップロードするオプションを備えた .mp3 ファイルを生成する Kokoro Text to Speech MCP サーバー。

使用場所: https://huggingface.co/spaces/hexgrad/Kokoro-TTS

構成

MCP 設定に以下を追加してください。ご自身の値に更新してください。

"kokoro-tts-mcp": { "command": "uv", "args": [ "--directory", "/path/toyourlocal/kokoro-tts-mcp", "run", "mcp-tts.py" ], "env": { "TTS_VOICE": "af_heart", "TTS_SPEED": "1.0", "TTS_LANGUAGE": "en-us", "AWS_ACCESS_KEY_ID": "", "AWS_SECRET_ACCESS_KEY": "", "AWS_REGION": "us-east-1", "AWS_S3_FOLDER": "mp3", "S3_ENABLED": "true", "MP3_FOLDER": "/path/to/mp3" } }

ffmmegをインストールする

これは.wavファイルを.mp3ファイルに変換するために必要です

Macの場合:

brew install ffmpeg

ローカルで実行するには、これらを.envファイルに追加してください。env.exampleを参照し、.envにコピーして、ご自身の値に変更してください。

サポートされている環境変数

  • AWS_ACCESS_KEY_ID : AWSアクセスキーID
  • AWS_SECRET_ACCESS_KEY : AWSシークレットアクセスキー
  • AWS_S3_BUCKET_NAME : S3バケット名
  • AWS_S3_REGION : S3リージョン(例:us-east-1)
  • AWS_S3_FOLDER : S3バケット内のフォルダパス
  • AWS_S3_ENDPOINT_URL : S3互換ストレージのオプションのカスタムエンドポイントURL
  • MCP_HOST : サーバーをバインドするホスト (デフォルト: 0.0.0.0)
  • MCP_PORT : リッスンするポート (デフォルト: 9876)
  • MCP_CLIENT_HOST : サーバーへのクライアント接続のホスト名 (デフォルト: localhost)
  • DEBUG : デバッグモードを有効にする(「true」または「1」に設定)
  • S3_ENABLED : S3アップロードを有効にする(「true」または「1」に設定)
  • MP3_FOLDER : MP3ファイルを保存するパス(デフォルトはスクリプトディレクトリ内の「mp3」フォルダ)
  • MP3_RETENTION_DAYS : MP3ファイルを自動的に削除するまで保存する日数
  • DELETE_LOCAL_AFTER_S3_UPLOAD : S3アップロードが成功した後にローカルのMP3ファイルを削除するかどうか(「true」または「1」に設定)
  • TTS_VOICE : TTSクライアントのデフォルトの音声(デフォルト: af_heart)
  • TTS_SPEED : TTSクライアントのデフォルト速度(デフォルト: 1.0)
  • TTS_LANGUAGE : TTSクライアントのデフォルト言語(デフォルト: en-us)

ローカルでサーバーを実行する

推奨される方法はUVを使用する

uv run mcp-tts.py

TTSクライアントの使用

mcp_client.pyスクリプトを使用すると、TTS リクエストをサーバーに送信できます。使い方は以下です。

接続設定

サーバーとクライアントを同じマシン上で実行する場合:

  • サーバーは0.0.0.0 (すべてのインターフェース) または127.0.0.1 (ローカルホストのみ) にバインドする必要があります
  • クライアントはlocalhostまたは127.0.0.1に接続する必要があります

基本的な使い方

python mcp_client.py --text "Hello, world!"

ファイルからテキストを読み込む

python mcp_client.py --file my_text.txt

音声と速度のカスタマイズ

python mcp_client.py --text "Hello, world!" --voice "en_female" --speed 1.2

S3アップロードを無効にする

python mcp_client.py --text "Hello, world!" --no-s3

コマンドラインオプション

python mcp_client.py --help

MP3ファイル管理

TTSサーバーはMP3ファイルを生成し、ローカルに保存するか、オプションでS3にアップロードします。これらのファイルの管理方法を設定できます。

ローカルストレージ

  • .envファイルでMP3_FOLDERを設定して、MP3ファイルが保存される場所を指定します。
  • ファイルは自動的に削除されない限りこのフォルダに保存されます

自動クリーンアップ

  • MP3_RETENTION_DAYS=30 (または任意の数字)を設定すると、その日数より古いファイルが自動的に削除されます。
  • DELETE_LOCAL_AFTER_S3_UPLOAD=trueを設定すると、S3 アップロードが成功した直後にローカルファイルを削除します。

S3統合

  • S3_ENABLED=trueまたはDISABLE_S3=trueで S3 アップロードを有効/無効にする
  • .envファイルで AWS 認証情報とバケット設定を構成する
  • S3アップロードはクライアントの--no-s3オプションを使用してリクエストごとに無効にすることができます。
-
security - not tested
A
license - permissive license
-
quality - not tested

オプションの S3 アップロード機能を備えた Kokoro TTS テクノロジーを使用してテキストから MP3 オーディオ ファイルを生成するサーバー。

  1. Configuration
    1. Install ffmmeg
    2. Supported Environment Variables
  2. Running the Server Locally
    1. Using the TTS Client
      1. Connection Settings
      2. Basic Usage
      3. Reading Text from a File
      4. Customizing Voice and Speed
      5. Disabling S3 Upload
      6. Command-line Options
    2. MP3 File Management
      1. Local Storage
      2. Automatic Cleanup
      3. S3 Integration
    ID: 8p689t0jsv