Интерактивный голосовой MCP-сервер (Kokoro TTS + NeMo ASR)
Сервер протокола контекстной модели, который обеспечивает возможности преобразования текста в речь (TTS) с использованием моделей Kokoro и преобразования речи в текст (STT) с использованием моделей NVIDIA NeMo Parakeet, позволяя вести интерактивные голосовые диалоги.
Доступные инструменты
interactive_voice_dialog
— преобразует текст в речь, воспроизводит ее, затем слушает речевой ввод пользователя и возвращает транскрипцию.- Требуемые аргументы:
text_to_speak
(строка): Текст, который произнесет помощник.
- Необязательные аргументы:
voice
(string): Голос, используемый для TTS (например, 'af_heart'). По умолчанию 'af_heart'.
- Требуемые аргументы:
Установка
Предпосылки
Для некоторых базовых моделей TTS требуется, чтобы в вашей системе был установлен espeak-ng
.
Установка Windows:
- Перейти к релизам espeak-ng .
- Нажмите «Последняя версия».
- Загрузите соответствующий файл
*.msi
(напримерespeak-ng-20191129-b702b03-x64.msi
). - Запустите загруженный установщик.
Установка локального развития
Чтобы разрешить Claude Desktop запускать этот сервер с помощью python -m mcp_server_tts
, вам нужно установить его как модуль Python. Установка в "редактируемом" режиме ( -e
) рекомендуется для разработки, так как это означает, что изменения в исходном коде отражаются немедленно, без необходимости переустановки.
Перейдите в каталог, содержащий файл pyproject.toml
(корень этого серверного проекта), и запустите:
После установки вы можете запустить его как скрипт, используя:
Конфигурация
Чтобы использовать этот сервер с Claude Desktop, вам нужно добавить его в файл claude_desktop_config.json
. Расположение этого файла обычно следующее: C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.json
Добавьте следующую запись под объектом mcpServers
в файле claude_desktop_config.json
:
Например, ваш раздел mcpServers
может выглядеть так:
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Обеспечивает голосовое взаимодействие с Клодом путем преобразования текста в речь с помощью Kokoro TTS и транскрибирования ответов пользователей с помощью NVIDIA NeMo ASR, создавая интерактивные голосовые диалоги.
Related MCP Servers
- -securityAlicense-qualityLets you use Claude Desktop, or any MCP Client, to use natural language to accomplish things with Neon.Last updated -600306TypeScriptMIT License
- AsecurityFlicenseAqualityFacilitates direct speech generation using Claude for multiple languages and emotions, integrating with a Zonos TTS setup via the Model Context Protocol.Last updated -19TypeScript
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityAlicense-qualityEnables Claude and other AI assistants to interact with your computer's audio system, allowing for recording from microphones and playing audio through speakers.Last updated -2PythonMIT License