대화형 음성 MCP 서버(Kokoro TTS + NeMo ASR)
Kokoro를 사용한 텍스트-음성(TTS) 기능과 NVIDIA NeMo Parakeet 모델을 사용한 음성-텍스트(STT) 기능을 제공하는 모델 컨텍스트 프로토콜 서버로, 대화형 음성 대화가 가능합니다.
사용 가능한 도구
interactive_voice_dialog- 텍스트를 음성으로 합성하고 재생한 다음, 사용자 음성 입력을 듣고 음성 변환본을 반환합니다.필수 인수:
text_to_speak(문자열): 도우미가 말할 텍스트입니다.
선택 인수:
voice(문자열): TTS에 사용할 음성(예: 'af_heart'). 기본값은 'af_heart'입니다.
설치
필수 조건
일부 기본 TTS 모델을 사용하려면 시스템에 espeak-ng 설치해야 합니다.
Windows 설치:
espeak-ng 릴리스 로 이동하세요.
"최신 릴리스"를 클릭하세요.
적절한
*.msi파일(예:espeak-ng-20191129-b702b03-x64.msi)을 다운로드하세요.다운로드한 설치 프로그램을 실행합니다.
지역 개발 설치
Claude Desktop에서 python -m mcp_server_tts 명령을 사용하여 이 서버를 실행하려면 Python 모듈로 설치해야 합니다. 개발 환경에서는 "편집 가능" 모드( -e )로 설치하는 것이 좋습니다. 이렇게 하면 소스 코드 변경 사항이 재설치 없이 즉시 반영됩니다.
pyproject.toml 파일이 있는 디렉토리(이 서버 프로젝트의 루트)로 이동하여 다음을 실행합니다.
지엑스피1
설치 후 다음을 사용하여 스크립트로 실행할 수 있습니다.
Related MCP server: Zonos TTS MCP Server
구성
이 서버를 Claude Desktop과 함께 사용하려면 claude_desktop_config.json 파일에 추가해야 합니다. 이 파일의 위치는 일반적으로 C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.json 입니다.
claude_desktop_config.json 의 mcpServers 개체 아래에 다음 항목을 추가합니다.
예를 들어, mcpServers 섹션은 다음과 같습니다.