Skip to main content
Glama

Interactive Voice MCP Server

by rungee84

Интерактивный голосовой MCP-сервер (Kokoro TTS + NeMo ASR)

Сервер протокола контекстной модели, который обеспечивает возможности преобразования текста в речь (TTS) с использованием моделей Kokoro и преобразования речи в текст (STT) с использованием моделей NVIDIA NeMo Parakeet, позволяя вести интерактивные голосовые диалоги.

Доступные инструменты

  • interactive_voice_dialog — преобразует текст в речь, воспроизводит ее, затем слушает речевой ввод пользователя и возвращает транскрипцию.
    • Требуемые аргументы:
      • text_to_speak (строка): Текст, который произнесет помощник.
    • Необязательные аргументы:
      • voice (string): Голос, используемый для TTS (например, 'af_heart'). По умолчанию 'af_heart'.

Установка

Предпосылки

Для некоторых базовых моделей TTS требуется, чтобы в вашей системе был установлен espeak-ng .

Установка Windows:

  1. Перейти к релизам espeak-ng .
  2. Нажмите «Последняя версия».
  3. Загрузите соответствующий файл *.msi (например espeak-ng-20191129-b702b03-x64.msi ).
  4. Запустите загруженный установщик.

Установка локального развития

Чтобы разрешить Claude Desktop запускать этот сервер с помощью python -m mcp_server_tts , вам нужно установить его как модуль Python. Установка в "редактируемом" режиме ( -e ) рекомендуется для разработки, так как это означает, что изменения в исходном коде отражаются немедленно, без необходимости переустановки.

Перейдите в каталог, содержащий файл pyproject.toml (корень этого серверного проекта), и запустите:

pip install -e .

После установки вы можете запустить его как скрипт, используя:

python -m mcp_server_tts.server # Assuming the main module is still server.py within mcp_server_tts # Or, if you create a new package structure: # python -m mcp_interactive_voice_server

Конфигурация

Чтобы использовать этот сервер с Claude Desktop, вам нужно добавить его в файл claude_desktop_config.json . Расположение этого файла обычно следующее: C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.json

Добавьте следующую запись под объектом mcpServers в файле claude_desktop_config.json :

"tts": { "command": "python", "args": ["-m", "mcp_server_tts"] }

Например, ваш раздел mcpServers может выглядеть так:

{ // ... other configurations ... "mcpServers": { // ... other servers ... "tts": { "command": "python", "args": ["-m", "mcp_server_tts"] } // ... other servers ... } // ... other configurations ... }
-
security - not tested
F
license - not found
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Обеспечивает голосовое взаимодействие с Клодом путем преобразования текста в речь с помощью Kokoro TTS и транскрибирования ответов пользователей с помощью NVIDIA NeMo ASR, создавая интерактивные голосовые диалоги.

  1. Доступные инструменты
    1. Установка
      1. Предпосылки
      2. Установка локального развития
    2. Конфигурация

      Related MCP Servers

      • -
        security
        A
        license
        -
        quality
        Lets you use Claude Desktop, or any MCP Client, to use natural language to accomplish things with Neon.
        Last updated -
        600
        306
        TypeScript
        MIT License
        • Linux
        • Apple
      • A
        security
        F
        license
        A
        quality
        Facilitates direct speech generation using Claude for multiple languages and emotions, integrating with a Zonos TTS setup via the Model Context Protocol.
        Last updated -
        1
        9
        TypeScript
        • Linux
      • -
        security
        F
        license
        -
        quality
        Provides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.
        Last updated -
        2
        Python
      • -
        security
        A
        license
        -
        quality
        Enables Claude and other AI assistants to interact with your computer's audio system, allowing for recording from microphones and playing audio through speakers.
        Last updated -
        2
        Python
        MIT License
        • Linux
        • Apple

      View all related MCP servers

      MCP directory API

      We provide all the information about MCP servers via our MCP API.

      curl -X GET 'https://glama.ai/api/mcp/v1/servers/rungee84/voice_mcp'

      If you have feedback or need assistance with the MCP directory API, please join our Discord server