Skip to main content
Glama

Interactive Voice MCP Server

by rungee84

インタラクティブ音声 MCP サーバー (Kokoro TTS + NeMo ASR)

Kokoro を使用したテキスト読み上げ (TTS) 機能と、NVIDIA NeMo Parakeet モデルを使用した音声テキスト変換 (STT) 機能を提供し、対話型音声ダイアログを可能にするモデル コンテキスト プロトコル サーバーです。

利用可能なツール

  • interactive_voice_dialog - テキストを音声に合成して再生し、ユーザーの音声入力を聞いて書き起こしを返します。
    • 必要な引数:
      • text_to_speak (文字列): アシスタントが話すテキスト。
    • オプションの引数:
      • voice (文字列): TTSで使用する音声(例:'af_heart')。デフォルトは'af_heart'です。

インストール

前提条件

基礎となる TTS モデルの一部では、システムにespeak-ngがインストールされている必要があります。

Windows インストール:

  1. espeak-ng リリースに移動します。
  2. 「最新リリース」をクリックします。
  3. 適切な*.msiファイル (例: espeak-ng-20191129-b702b03-x64.msi ) をダウンロードします。
  4. ダウンロードしたインストーラーを実行します。

ローカル開発インストール

Claude Desktop がpython -m mcp_server_ttsを使用してこのサーバーを起動できるようにするには、Python モジュールとしてインストールする必要があります。開発環境では、「編集可能」モード ( -e ) でインストールすることをお勧めします。これにより、ソースコードへの変更が再インストールなしで即座に反映されます。

pyproject.tomlファイル (このサーバー プロジェクトのルート) を含むディレクトリに移動し、次を実行します。

pip install -e .

インストール後、次のコマンドを使用してスクリプトとして実行できます。

python -m mcp_server_tts.server # Assuming the main module is still server.py within mcp_server_tts # Or, if you create a new package structure: # python -m mcp_interactive_voice_server

構成

Claude Desktopでこのサーバーを使用するには、 claude_desktop_config.jsonファイルに追加する必要があります。このファイルの場所は通常、 C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.jsonです。

claude_desktop_config.jsonmcpServersオブジェクトの下に次のエントリを追加します。

"tts": { "command": "python", "args": ["-m", "mcp_server_tts"] }

たとえば、 mcpServersセクションは次のようになります。

{ // ... other configurations ... "mcpServers": { // ... other servers ... "tts": { "command": "python", "args": ["-m", "mcp_server_tts"] } // ... other servers ... } // ... other configurations ... }
-
security - not tested
F
license - not found
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Kokoro TTS を使用してテキストを音声に変換し、NVIDIA NeMo ASR を使用してユーザーの応答を書き起こし、対話型の音声ダイアログを作成することで、Claude との音声ベースのインタラクションが可能になります。

  1. 利用可能なツール
    1. インストール
      1. 前提条件
      2. ローカル開発インストール
    2. 構成

      Related MCP Servers

      • -
        security
        A
        license
        -
        quality
        Lets you use Claude Desktop, or any MCP Client, to use natural language to accomplish things with Neon.
        Last updated -
        600
        306
        TypeScript
        MIT License
        • Linux
        • Apple
      • A
        security
        F
        license
        A
        quality
        Facilitates direct speech generation using Claude for multiple languages and emotions, integrating with a Zonos TTS setup via the Model Context Protocol.
        Last updated -
        1
        9
        TypeScript
        • Linux
      • -
        security
        F
        license
        -
        quality
        Provides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.
        Last updated -
        2
        Python
      • -
        security
        A
        license
        -
        quality
        Enables Claude and other AI assistants to interact with your computer's audio system, allowing for recording from microphones and playing audio through speakers.
        Last updated -
        2
        Python
        MIT License
        • Linux
        • Apple

      View all related MCP servers

      MCP directory API

      We provide all the information about MCP servers via our MCP API.

      curl -X GET 'https://glama.ai/api/mcp/v1/servers/rungee84/voice_mcp'

      If you have feedback or need assistance with the MCP directory API, please join our Discord server