필수 조건
- 파이썬 3.10+;
- Mobvoi Sequence Monkey 오픈 플랫폼 에서 APP_KEY와 APP_SECRET을 받으세요. 신규 사용자는 무료 할당량을 신청할 수 있습니다.
uv
(Python 패키지 관리자)를 설치하고,pip install uv
로 설치하거나,uv
저장소에서 추가 설치 방법을 확인하세요.
Mobvoi TTS MCP로 무엇을 할 수 있나요?
Mobvoi TTS MCP는 현재 다음 기능을 지원합니다.
- 음성 복제: URL 오디오 파일 링크 또는 제공하신 로컬 오디오 파일을 기반으로 음성을 복제하고, 화자 ID를 반환합니다. 이 화자 ID를 사용하여 음성을 생성할 수 있습니다.
- 음성 합성: 지정된 텍스트 콘텐츠에서 음성을 생성하기 위해 화자 ID를 지정할 수 있습니다. 또한, 음성 속도 및 음량과 같은 음성 속성을 조정할 수도 있습니다. 자세한 내용은 Mobvoi Sequence Monkey 오픈 플랫폼 TTS 파트 의 설명서를 참조하십시오.
- 음성 방송: 지정된 오디오 파일을 재생합니다.
커서를 사용한 빠른 시작
커서 -> 커서 설정 -> MCP로 가서 Add new global MCP server
클릭하면 mcp.json이 열립니다. 다음 구성 내용을 붙여넣으세요.
지엑스피1
Claude Desktop으로 빠른 시작
Claude Desktop -> 설정 -> 개발자로 이동하여 Edit Config
클릭하고 claude_desktop_config.json
열고 다음 구성 내용을 붙여넣습니다.
Cline과 함께하는 빠른 시작
VSCode EXTENSIONS에 Cline 확장 프로그램을 설치하고 Cline -> MCP 서버 -> 설치됨으로 이동한 다음 Config MCP Servers
클릭하면 cline_mcp_settings.json
열리고 다음 구성 내용을 붙여넣습니다.
MacOS 및 Linux 시스템의 경우, 위의 내용을 참조하여 구성하실 수 있습니다. Windows 시스템은 아직 테스트하지 않았습니다.
소스 코드 테스트
소스코드를 기반으로 테스트를 진행하거나, 이 저장소를 기반으로 2차 개발을 진행하려는 경우, 다음과 같은 방법으로 구성할 수 있습니다.
예를 들어 클라인을 살펴보면 다른 클라이언트의 구성도 비슷합니다.
사용 예
- 오디오 파일(로컬 또는 원격)에서 음성을 복제해 보세요. 커서 에이전트 모드에서 다음 내용을 입력하세요: " https://tc-nj-backend-pub-cdn.mobvoi.com/subtitles/wav/9e5d439e0e9142966037fb80fe9e0d8e.wav , 이 음성을 복제하세요"
- 화자를 지정하고, 텍스트에서 음성을 합성하여 소리 내어 재생합니다. 다음과 같이 모델을 안내합니다. "방금 복제한 소리를 사용하여 'Mobvoi TTS MCP를 사용해 보세요.'라고 방송합니다."
- 데모 영상:
문제 해결
uvx ENOENT 생성
"MCP Mobvoi TTS: spawn uvx ENOENT" 오류가 발생하면 터미널에서 다음 명령을 실행하여 절대 경로를 확인하세요. which uvx
절대 경로(예: /usr/local/bin/uvx)를 얻은 후 해당 경로를 사용하도록 설정을 업데이트하세요(예: "command": "/usr/local/bin/uvx"). 이렇게 하면 올바른 실행 파일이 참조됩니다.
MCP 오류 -32001: 요청 시간이 초과되었습니다.
이 오류가 발생하면 네트워크에 문제가 있음을 의미합니다. 중국 본토에 거주하는 경우 다음과 같은 방법으로 추가 pypi 소스를 구성하는 것이 좋습니다.
추가 pypi 소스는 args의 맨 앞에서 구성해야 합니다.
최신 PyPI 패키지를 동기화할 수 없습니다.
이런 상황이 발생하는 경우 다음과 같은 이유로 인해 발생할 수 있습니다. 1) 네트워크 문제; 2) 캐시 문제; 3) 지정된 미러 소스가 mobvoi-tts-mcp 패키지를 동기화하지 않았습니다. 미러 소스를 사용하는 경우 다음과 같은 방법으로 사용 중인 미러 소스에서 mobvoi-tts-mcp 패키지가 동기화되었는지 먼저 확인해야 합니다. pip index versions --index-url https://pypi.tuna.tsinghua.edu.cn/simple mobvoi-tts-mcp
최신 버전 번호가 PyPI와 일치하는 경우 미러 소스를 사용하여 최신 mobvoi-tts-mcp 패키지를 업데이트할 수 있습니다. 그렇지 않은 경우 업데이트에 https://pypi.org/simple 만 사용할 수 있습니다. 일반적으로 PyPI에 새 패키지가 릴리스된 후 미러 소스가 동기화되는 데 수십 분의 지연이 발생합니다. 동시에 다음 구성을 참조하여 캐시를 업데이트하고 지울 수 있습니다.
Mobvoi의 텍스트 음성 변환 및 음성 복제 API와 상호 작용할 수 있는 모델 컨텍스트 프로토콜 서버로, Cursor, Claude Desktop, Cline과 같은 MCP 클라이언트가 음성을 생성하고 음성을 복제할 수 있습니다.
Related Resources
Related MCP Servers
- -securityAlicense-qualityA Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.Last updated -TypeScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -1154JavaScriptThe Unlicense
ElevenLabs MCP Serverofficial
AsecurityAlicenseAqualityAn official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.Last updated -19771PythonMIT LicenseGladia MCPofficial
-security-license-qualityOfficial Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.Last updated -PythonMIT License