음성 MCP 서버
Kokoro TTS 모델을 사용하여 텍스트-음성 변환 기능을 제공하는 모델 컨텍스트 프로토콜 서버입니다.
구성
다음 환경 변수를 사용하여 서버를 구성할 수 있습니다.
변하기 쉬운 | 설명 | 기본 | 유효 범위 |
---|---|---|---|
MCP_DEFAULT_SPEECH_SPEED | 텍스트 음성 변환을 위한 기본 속도 배수 | 1.1 | 0.5에서 2.0까지 |
커서에서:
지엑스피1
특징
- 🎯 Kokoro TTS 모델을 사용한 고품질 텍스트 음성 변환
- 🗣️ 다양한 음성 옵션 제공
- 🎛️ 사용자 정의 가능한 음성 매개변수(음성, 속도)
- 🔌 MCP 호환 인터페이스
- 📦 간편한 설치 및 설정
- 🚀 API 키가 필요하지 않습니다
설치
용법
서버를 실행합니다:
서버는 다음과 같은 MCP 도구를 제공합니다.
text_to_speech
: 기본 텍스트-음성 변환text_to_speech_with_options
: 사용자 정의 가능한 속도의 텍스트 음성 변환list_voices
: 사용 가능한 모든 음성을 나열합니다.get_model_status
: TTS 모델의 초기화 상태를 확인합니다.
개발
사용 가능한 도구
1. 텍스트 음성 변환
기본 설정을 사용하여 텍스트를 음성으로 변환합니다.
2. 텍스트_음성_변환_옵션
사용자 정의 가능한 매개변수를 사용하여 텍스트를 음성으로 변환합니다.
3. 목록_음성
텍스트 음성 변환에 사용 가능한 모든 음성을 나열합니다.
4. 모델 상태 가져오기
TTS 모델 초기화의 현재 상태를 확인하세요. 특히 서버를 처음 시작할 때 모델을 다운로드하고 초기화해야 하므로 유용합니다.
응답 예:
가능한 상태 값:
uninitialized
: 모델 초기화가 시작되지 않았습니다.initializing
: 모델이 다운로드되고 초기화됩니다.ready
: 모델을 사용할 준비가 되었습니다.error
: 초기화 중 오류가 발생했습니다.
테스트
MCP Inspector를 사용하거나 원시 JSON 메시지를 보내어 서버를 테스트할 수 있습니다.
Claude Desktop과 통합
Claude Desktop과 함께 이 서버를 사용하려면 Claude Desktop 구성 파일( ~/Library/Application Support/Claude/claude_desktop_config.json
)에 다음을 추가하세요.
기여하다
기여를 환영합니다! 풀 리퀘스트를 제출해 주세요.
특허
MIT 라이센스 - 자세한 내용은 LICENSE 파일을 참조하세요.
문제 해결
모델 초기화 문제
서버는 시작 시 자동으로 TTS 모델을 다운로드하고 초기화하려고 시도합니다. 초기화 오류가 발생하는 경우:
- 서버는 시도 사이에 정리 작업을 거쳐 최대 3회까지 자동으로 재시도합니다.
get_model_status
도구를 사용하여 초기화 진행 상황과 오류를 모니터링합니다.- 모든 재시도 후에도 초기화가 실패하면 모델 파일을 수동으로 제거해보세요.
이제 get_model_status
도구는 응답에 재시도 정보를 포함합니다.
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Kokoro TTS 모델을 사용하여 텍스트-음성 변환 기능을 제공하는 모델 컨텍스트 프로토콜 서버로, 다양한 음성 옵션과 사용자 정의 가능한 음성 매개변수를 제공합니다.
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
- -securityAlicense-qualityA Model Context Protocol server that enables AI models to interact with VoIPBin's VoIP services, supporting features like call management, agent management, campaigns, conferences, and chat functionality.Last updated -2PythonMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -1154JavaScriptThe Unlicense
Appeared in Searches
- A service to convert text to ready-to-use audio with download, player, or embed options
- Using Hugging Face for Text-to-Audio, Image, and Video Generation
- A search for translation services or tools
- A system for retrieving medical knowledge, especially in medical imaging, and generating reports
- Creating an AI Chatbot for a Shopify Store