tts-mcp
OpenAI TTS API を使用して高品質のテキスト読み上げを生成するためのモデル コンテキスト プロトコル (MCP) サーバーおよびコマンドライン ツール。
主な特徴
- MCP サーバー: Claude Desktop やその他の MCP 対応クライアントとテキスト読み上げ機能を統合します
- 音声オプション: 複数の音声キャラクター (アロイ、ノヴァ、エコーなど) をサポート
- 高品質オーディオ: さまざまな出力形式をサポート (MP3、WAV、OPUS、AAC)
- カスタマイズ可能: 音声速度、音声キャラクター、追加の指示を設定できます
- CLIツール: 直接テキストを音声に変換するコマンドラインユーティリティとしても利用可能
インストール
方法1: リポジトリからインストールする
方法2: npx で直接実行する(インストール不要)
MCP サーバーの使用状況
MCP サーバーを使用すると、Claude Desktop などの Model Context Protocol (MCP) 互換クライアントとテキスト読み上げ機能を統合できます。
MCPサーバーの起動
MCP サーバー オプション
MCPクライアントとの統合
MCPサーバーは、Claude Desktopおよびその他のMCP対応クライアントで使用できます。Claude Desktopとの連携については、以下をご覧ください。
- Claude Desktop 構成ファイルを開きます (通常は
~/Library/Application Support/Claude/claude_desktop_config.json
にあります) - OpenAI API キーを含む次の構成を追加します。
あるいは、npx を使用するとセットアップが簡単になります。
API キーは次の 2 つの方法で提供できます。
- 直接的な方法(テストに推奨):
--api-key
パラメータを使用してargs
配列に含める - 環境変数メソッド(より安全):上記のように
env
オブジェクトに設定する
セキュリティに関する注意: API キーを含める場合は、必ず構成ファイルを保護してください。
- Claudeデスクトップを再起動します
- クロードに「このテキストを読み上げて」などのリクエストをすると、テキストが音声に変換されます。
利用可能なMCPツール
- テキスト読み上げ: テキストを音声に変換して再生するツール
CLIツールの使用
tts-mcp をスタンドアロンのコマンドライン ツールとして使用することもできます。
CLIツールオプション
サポートされている音声
次の音声キャラクターがサポートされています:
- 合金(デフォルト)
- 灰
- コーラル
- エコー
- 寓話
- オニキス
- 新星
- セージ
- きらめき
サポートされているモデル
- tts-1
- tts-1-hd
- gpt-4o-mini-tts(デフォルト)
出力形式
次の出力形式がサポートされています。
- mp3(デフォルト)
- 作品
- AAc
- フラック
- ウェーブ
- PCM
環境変数
システム環境変数を使用してツールを構成することもできます。
ライセンス
マサチューセッツ工科大学
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
高品質のテキスト読み上げ機能を Claude Desktop やその他の MCP 互換クライアントと統合し、複数の音声オプションとオーディオ形式をサポートするモデル コンテキスト プロトコル サーバーです。
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityFlicense-qualityA Model Context Protocol server that provides text-to-speech capabilities using the Kokoro TTS model, offering multiple voice options and customizable speech parameters.Last updated -239JavaScript
ElevenLabs MCP Serverofficial
AsecurityAlicenseAqualityAn official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.Last updated -19700PythonMIT LicenseGladia MCPofficial
-security-license-qualityOfficial Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.Last updated -PythonMIT License