インタラクティブ音声 MCP サーバー (Kokoro TTS + NeMo ASR)
Kokoro を使用したテキスト読み上げ (TTS) 機能と、NVIDIA NeMo Parakeet モデルを使用した音声テキスト変換 (STT) 機能を提供し、対話型音声ダイアログを可能にするモデル コンテキスト プロトコル サーバーです。
利用可能なツール
interactive_voice_dialog
- テキストを音声に合成して再生し、ユーザーの音声入力を聞いて書き起こしを返します。- 必要な引数:
text_to_speak
(文字列): アシスタントが話すテキスト。
- オプションの引数:
voice
(文字列): TTSで使用する音声(例:'af_heart')。デフォルトは'af_heart'です。
- 必要な引数:
インストール
前提条件
基礎となる TTS モデルの一部では、システムにespeak-ng
がインストールされている必要があります。
Windows インストール:
- espeak-ng リリースに移動します。
- 「最新リリース」をクリックします。
- 適切な
*.msi
ファイル (例:espeak-ng-20191129-b702b03-x64.msi
) をダウンロードします。 - ダウンロードしたインストーラーを実行します。
ローカル開発インストール
Claude Desktop がpython -m mcp_server_tts
を使用してこのサーバーを起動できるようにするには、Python モジュールとしてインストールする必要があります。開発環境では、「編集可能」モード ( -e
) でインストールすることをお勧めします。これにより、ソースコードへの変更が再インストールなしで即座に反映されます。
pyproject.toml
ファイル (このサーバー プロジェクトのルート) を含むディレクトリに移動し、次を実行します。
インストール後、次のコマンドを使用してスクリプトとして実行できます。
構成
Claude Desktopでこのサーバーを使用するには、 claude_desktop_config.json
ファイルに追加する必要があります。このファイルの場所は通常、 C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.json
です。
claude_desktop_config.json
のmcpServers
オブジェクトの下に次のエントリを追加します。
たとえば、 mcpServers
セクションは次のようになります。
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Kokoro TTS を使用してテキストを音声に変換し、NVIDIA NeMo ASR を使用してユーザーの応答を書き起こし、対話型の音声ダイアログを作成することで、Claude との音声ベースのインタラクションが可能になります。
Related MCP Servers
- -securityAlicense-qualityLets you use Claude Desktop, or any MCP Client, to use natural language to accomplish things with Neon.Last updated -600306TypeScriptMIT License
- AsecurityFlicenseAqualityFacilitates direct speech generation using Claude for multiple languages and emotions, integrating with a Zonos TTS setup via the Model Context Protocol.Last updated -19TypeScript
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityAlicense-qualityEnables Claude and other AI assistants to interact with your computer's audio system, allowing for recording from microphones and playing audio through speakers.Last updated -2PythonMIT License