Интерактивный голосовой MCP-сервер (Kokoro TTS + NeMo ASR)
Сервер протокола контекстной модели, который обеспечивает возможности преобразования текста в речь (TTS) с использованием моделей Kokoro и преобразования речи в текст (STT) с использованием моделей NVIDIA NeMo Parakeet, позволяя вести интерактивные голосовые диалоги.
Доступные инструменты
interactive_voice_dialog— преобразует текст в речь, воспроизводит ее, затем слушает речевой ввод пользователя и возвращает транскрипцию.Требуемые аргументы:
text_to_speak(строка): Текст, который произнесет помощник.
Необязательные аргументы:
voice(string): Голос, используемый для TTS (например, 'af_heart'). По умолчанию 'af_heart'.
Установка
Предпосылки
Для некоторых базовых моделей TTS требуется, чтобы в вашей системе был установлен espeak-ng .
Установка Windows:
Перейти к релизам espeak-ng .
Нажмите «Последняя версия».
Загрузите соответствующий файл
*.msi(напримерespeak-ng-20191129-b702b03-x64.msi).Запустите загруженный установщик.
Установка локального развития
Чтобы разрешить Claude Desktop запускать этот сервер с помощью python -m mcp_server_tts , вам нужно установить его как модуль Python. Установка в "редактируемом" режиме ( -e ) рекомендуется для разработки, так как это означает, что изменения в исходном коде отражаются немедленно, без необходимости переустановки.
Перейдите в каталог, содержащий файл pyproject.toml (корень этого серверного проекта), и запустите:
После установки вы можете запустить его как скрипт, используя:
Related MCP server: Zonos TTS MCP Server
Конфигурация
Чтобы использовать этот сервер с Claude Desktop, вам нужно добавить его в файл claude_desktop_config.json . Расположение этого файла обычно следующее: C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.json
Добавьте следующую запись под объектом mcpServers в файле claude_desktop_config.json :
Например, ваш раздел mcpServers может выглядеть так: