Skip to main content
Glama

Interactive Voice MCP Server

by rungee84

Интерактивный голосовой MCP-сервер (Kokoro TTS + NeMo ASR)

Сервер протокола контекстной модели, который обеспечивает возможности преобразования текста в речь (TTS) с использованием моделей Kokoro и преобразования речи в текст (STT) с использованием моделей NVIDIA NeMo Parakeet, позволяя вести интерактивные голосовые диалоги.

Доступные инструменты

  • interactive_voice_dialog — преобразует текст в речь, воспроизводит ее, затем слушает речевой ввод пользователя и возвращает транскрипцию.
    • Требуемые аргументы:
      • text_to_speak (строка): Текст, который произнесет помощник.
    • Необязательные аргументы:
      • voice (string): Голос, используемый для TTS (например, 'af_heart'). По умолчанию 'af_heart'.

Установка

Предпосылки

Для некоторых базовых моделей TTS требуется, чтобы в вашей системе был установлен espeak-ng .

Установка Windows:

  1. Перейти к релизам espeak-ng .
  2. Нажмите «Последняя версия».
  3. Загрузите соответствующий файл *.msi (например espeak-ng-20191129-b702b03-x64.msi ).
  4. Запустите загруженный установщик.

Установка локального развития

Чтобы разрешить Claude Desktop запускать этот сервер с помощью python -m mcp_server_tts , вам нужно установить его как модуль Python. Установка в "редактируемом" режиме ( -e ) рекомендуется для разработки, так как это означает, что изменения в исходном коде отражаются немедленно, без необходимости переустановки.

Перейдите в каталог, содержащий файл pyproject.toml (корень этого серверного проекта), и запустите:

pip install -e .

После установки вы можете запустить его как скрипт, используя:

python -m mcp_server_tts.server # Assuming the main module is still server.py within mcp_server_tts # Or, if you create a new package structure: # python -m mcp_interactive_voice_server

Конфигурация

Чтобы использовать этот сервер с Claude Desktop, вам нужно добавить его в файл claude_desktop_config.json . Расположение этого файла обычно следующее: C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.json

Добавьте следующую запись под объектом mcpServers в файле claude_desktop_config.json :

"tts": { "command": "python", "args": ["-m", "mcp_server_tts"] }

Например, ваш раздел mcpServers может выглядеть так:

{ // ... other configurations ... "mcpServers": { // ... other servers ... "tts": { "command": "python", "args": ["-m", "mcp_server_tts"] } // ... other servers ... } // ... other configurations ... }
-
security - not tested
F
license - not found
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Обеспечивает голосовое взаимодействие с Клодом путем преобразования текста в речь с помощью Kokoro TTS и транскрибирования ответов пользователей с помощью NVIDIA NeMo ASR, создавая интерактивные голосовые диалоги.

  1. Доступные инструменты
    1. Установка
      1. Предпосылки
      2. Установка локального развития
    2. Конфигурация

      Related MCP Servers

      • -
        security
        A
        license
        -
        quality
        Lets you use Claude Desktop, or any MCP Client, to use natural language to accomplish things with Neon.
        Last updated -
        664
        386
        TypeScript
        MIT License
        • Linux
        • Apple
      • A
        security
        F
        license
        A
        quality
        Facilitates direct speech generation using Claude for multiple languages and emotions, integrating with a Zonos TTS setup via the Model Context Protocol.
        Last updated -
        1
        0
        12
        TypeScript
        • Linux
      • A
        security
        A
        license
        A
        quality
        Enables natural language interaction with Azure services through Claude Desktop, supporting resource management, subscription handling, and tenant selection with secure authentication.
        Last updated -
        3
        7
        14
        TypeScript
        MIT License
      • A
        security
        A
        license
        A
        quality
        Provides intelligent transcript processing capabilities for Claude, featuring natural formatting, contextual repair, and smart summarization powered by Deep Thinking LLMs.
        Last updated -
        4
        15
        TypeScript
        MIT License

      View all related MCP servers

      MCP directory API

      We provide all the information about MCP servers via our MCP API.

      curl -X GET 'https://glama.ai/api/mcp/v1/servers/rungee84/voice_mcp'

      If you have feedback or need assistance with the MCP directory API, please join our Discord server