📢 떠벌리기-MCP 🗣️
OpenAI의 텍스트 음성 변환 API를 사용하여 LLM에 음성을 제공하는 MCP 서버! 🔊
✨ 특징
- 텍스트-음성 변환: 입력 텍스트를 고품질 음성 오디오로 변환합니다.
- 음성 선택: 다양한 OpenAI 음성(
alloy
,echo
,fable
,onyx
,nova
,shimmer
) 중에서 선택하세요. - 모델 선택: 표준(
tts-1
) 또는 고화질(tts-1-hd
) 모델을 사용하세요. - 형식 옵션:
mp3
,opus
,aac
또는flac
형식으로 오디오를 출력합니다. - 파일 저장: 생성된 오디오를 로컬 파일에 저장합니다.
- 선택적 재생: 구성 가능한 시스템 명령을 사용하여 생성된 오디오를 자동으로 재생합니다.
- 구성 가능한 기본값: 구성을 통해 기본 음성을 설정합니다.
🔧 구성
이 서버를 사용하려면 MCP 클라이언트의 설정 파일(예: mcp_settings.json
)에 해당 구성을 추가해야 합니다.
- OpenAI API 키 받기: OpenAI 의 API 키가 필요합니다.
- MCP 설정에 추가: 설정 파일의
mcpServers
개체에 다음 블록을 추가하고"YOUR_OPENAI_API_KEY"
실제 키로 바꿉니다.
지엑스피1
중요: args
경로가 blabber-mcp
프로젝트 디렉터리 내 build/index.js
파일의 올바른 위치를 가리키는지 확인하세요. 전체 절대 경로를 사용하세요.
🚀 사용법
구성하고 실행하면 MCP 클라이언트를 통해 text_to_speech
도구를 사용할 수 있습니다.
도구: text_to_speech
서버: blabber-mcp
(또는 config에서 사용한 키)
인수:
input
(문자열, 필수 ): 합성할 텍스트입니다.voice
(문자열, 선택 사항): 사용할 음성(alloy
,echo
,fable
,onyx
,nova
,shimmer
). 기본값은 config에 설정된DEFAULT_TTS_VOICE
또는nova
.model
(문자열, 선택 사항): 모델(tts-1
,tts-1-hd
). 기본값은tts-1
입니다.response_format
(문자열, 선택 사항): 오디오 형식(mp3
,opus
,aac
,flac
). 기본값은mp3
입니다.play
(부울, 선택 사항): 저장 후 오디오를 자동으로 재생하려면true
로 설정합니다. 기본값은false
입니다.
예시 도구 호출(재생 포함):
산출:
이 도구는 오디오 파일을 blabber-mcp
프로젝트 폴더 내의 output/
디렉토리에 저장하고 다음과 같은 JSON 응답을 반환합니다.
📜 라이센스
이 프로젝트는 MIT 라이선스에 따라 라이선스가 부여되었습니다. 자세한 내용은 라이선스 파일을 참조하세요.
🕒 변경 사항
버전 기록에 대한 자세한 내용은 CHANGELOG.md 파일을 참조하세요.
Related MCP Servers
- AsecurityAlicenseAqualityA MCP server that enables transcription of audio files using OpenAI's Speech-to-Text API, with support for multiple languages and file saving options.Last updated -12JavaScriptMIT License
ElevenLabs MCP Serverofficial
AsecurityAlicenseAqualityAn official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.Last updated -19700PythonMIT License- -security-license-qualityAn MCP server that enables LLMs to access the NijiVoice API for text-to-speech generation, supporting features like fetching available voice actors and checking credit balance.Last updated -1PythonMIT License
- -securityFlicense-qualityAn MCP server that downloads videos/extracts audio from various platforms like YouTube, Bilibili, and TikTok, then transcribes them to text using OpenAI's Whisper model.Last updated -2Python