대화형 음성 MCP 서버(Kokoro TTS + NeMo ASR)
Kokoro를 사용한 텍스트-음성(TTS) 기능과 NVIDIA NeMo Parakeet 모델을 사용한 음성-텍스트(STT) 기능을 제공하는 모델 컨텍스트 프로토콜 서버로, 대화형 음성 대화가 가능합니다.
사용 가능한 도구
interactive_voice_dialog
- 텍스트를 음성으로 합성하고 재생한 다음, 사용자 음성 입력을 듣고 음성 변환본을 반환합니다.- 필수 인수:
text_to_speak
(문자열): 도우미가 말할 텍스트입니다.
- 선택 인수:
voice
(문자열): TTS에 사용할 음성(예: 'af_heart'). 기본값은 'af_heart'입니다.
- 필수 인수:
설치
필수 조건
일부 기본 TTS 모델을 사용하려면 시스템에 espeak-ng
설치해야 합니다.
Windows 설치:
- espeak-ng 릴리스 로 이동하세요.
- "최신 릴리스"를 클릭하세요.
- 적절한
*.msi
파일(예:espeak-ng-20191129-b702b03-x64.msi
)을 다운로드하세요. - 다운로드한 설치 프로그램을 실행합니다.
지역 개발 설치
Claude Desktop에서 python -m mcp_server_tts
명령을 사용하여 이 서버를 실행하려면 Python 모듈로 설치해야 합니다. 개발 환경에서는 "편집 가능" 모드( -e
)로 설치하는 것이 좋습니다. 이렇게 하면 소스 코드 변경 사항이 재설치 없이 즉시 반영됩니다.
pyproject.toml
파일이 있는 디렉토리(이 서버 프로젝트의 루트)로 이동하여 다음을 실행합니다.
지엑스피1
설치 후 다음을 사용하여 스크립트로 실행할 수 있습니다.
구성
이 서버를 Claude Desktop과 함께 사용하려면 claude_desktop_config.json
파일에 추가해야 합니다. 이 파일의 위치는 일반적으로 C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.json
입니다.
claude_desktop_config.json
의 mcpServers
개체 아래에 다음 항목을 추가합니다.
예를 들어, mcpServers
섹션은 다음과 같습니다.
Related MCP Servers
- -securityAlicense-qualityLets you use Claude Desktop, or any MCP Client, to use natural language to accomplish things with Neon.Last updated -600306TypeScriptMIT License
- AsecurityFlicenseAqualityFacilitates direct speech generation using Claude for multiple languages and emotions, integrating with a Zonos TTS setup via the Model Context Protocol.Last updated -19TypeScript
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityAlicense-qualityEnables Claude and other AI assistants to interact with your computer's audio system, allowing for recording from microphones and playing audio through speakers.Last updated -2PythonMIT License