remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Integrations
Supports reading LaTeX formulas in text-to-speech functionality with configurable options for pronunciation.
Required as a runtime environment for the MCP server with version 16 or higher needed as a prerequisite.
미니맥스 MCP 도구
AI 기반 이미지 생성 및 텍스트-음성 변환 기능을 위한 Minimax API 통합을 통한 MCP(모델 컨텍스트 프로토콜) 서버 구현.
특징
- 이미지 생성 : Minimax의 image-01 모델을 사용하여 텍스트 프롬프트를 기반으로 고품질 이미지를 생성합니다.
- 텍스트 음성 변환(TTS) : 다양한 음성 옵션, 감정 및 오디오 형식을 사용하여 텍스트를 자연스러운 음성으로 변환합니다.
- 간편한 통합 : Windsurf 편집기와 MCP 서버로 원활하게 통합됩니다.
설정
필수 조건
- Node.js 16 이상
- Minimax API 키( Minimax 플랫폼 에서 획득)
- TTS 기능을 위한 Minimax 그룹 ID
구성
MCP 구성 파일을 만들거나 업데이트하세요.
- Windsurf의 경우:
~/.codeium/windsurf/mcp_config.json
- 커서의 경우:
~/.cursor/config/mcp_config.json
두 편집기 모두 동일한 구성 형식을 사용합니다.
지엑스피1
MCP 인터페이스
이미지 생성
텍스트 프롬프트를 기반으로 이미지 생성:
Copy
매개변수:
prompt
(필수): 생성할 이미지에 대한 설명outputFile
(필수): 생성된 이미지 파일을 저장할 절대 경로입니다. 해당 디렉터리는 이미 존재해야 합니다 . 여러 이미지(n>1)를 생성하는 경우, 파일 이름은 순차적인 번호로 지정됩니다(예: 'image-1.jpg', 'image-2.jpg').aspectRatio
(선택 사항): 이미지의 종횡비(기본값: "1:1", 옵션: "1:1", "16:9", "4:3", "3:2", "2:3", "3:4", "9:16", "21:9")n
(선택 사항): 생성할 이미지 개수(기본값: 1, 범위: 1~9). n>1이면 출력 파일 이름에 자동으로 번호가 매겨집니다.subjectReference
(선택 사항): 로컬 이미지 파일 경로 또는 캐릭터 참조용 공개 URL입니다. 이 값을 입력하면 생성된 이미지에서 캐릭터 모양에 대한 참조로 사용됩니다. 지원 형식: JPG, JPEG, PNG
텍스트 음성 변환
다양한 사용자 정의 옵션을 사용하여 텍스트를 음성으로 변환합니다.
Copy
기본 매개변수:
text
(필수): 음성으로 변환할 텍스트(최대 10,000자)outputFile
(필수): 생성된 오디오 파일을 저장할 절대 경로model
(선택 사항): 사용할 모델 버전(기본값: "speech-02-hd", 옵션: "speech-02-hd", "speech-02-turbo")speech-02-hd
: 음색 유사성, 리듬 안정성, 스튜디오급 오디오 품질을 갖춘 고화질 모델speech-02-turbo
: 뛰어난 성능과 낮은 지연 시간을 갖춘 빠른 모델, 향상된 다국어 기능
voiceId
(선택 사항): 사용할 음성 ID(기본값: "male-qn-qingse")speed
(선택 사항): 음성 속도(기본값: 1.0, 범위: 0.5-2.0)volume
(선택 사항): 음성 볼륨(기본값: 1.0, 범위: 0.1-10.0)pitch
(선택 사항): 음성 피치(기본값: 0, 범위: -12~12)emotion
(선택 사항): 연설의 감정(기본값: "중립", 옵션: "행복", "슬픔", "화남", "두려움", "혐오", "놀람", "중립")timberWeights
(선택 사항): 음성 믹싱 설정, 최대 4개의 다른 음성을 가중치로 믹싱할 수 있음Copy
오디오 설정:
format
(선택 사항): 오디오 형식(기본값: "mp3", 옵션: "mp3", "pcm", "flac", "wav")sampleRate
(선택 사항): 샘플링 속도(Hz)(기본값: 32000, 옵션: 8000, 16000, 22050, 24000, 32000, 44100)bitrate
(선택 사항): MP3 형식의 비트 전송률(기본값: 128000, 옵션: 32000, 64000, 128000, 256000)channel
(선택 사항): 오디오 채널 수(기본값: 1, 옵션: 1=모노, 2=스테레오)
고급 기능:
latexRead
(선택 사항): LaTeX 수식을 읽을지 여부(기본값: false)pronunciationDict
(선택 사항): 발음 대체 목록Copystream
(선택 사항): 스트리밍 모드를 사용할지 여부(기본값: false)languageBoost
(선택 사항): 특정 언어 인식 향상- 옵션: "중국어", "중국어(월어)", "영어", "아랍어", "러시아어", "스페인어", "프랑스어", "포르투갈어", "독일어", "터키어", "네덜란드어", "우크라이나어", "베트남어", "인도네시아어", "일본어", "이탈리아어", "한국어", "태국어", "폴란드어", "루마니아어", "그리스어", "체코어", "핀란드어", "힌디어", "자동"
subtitleEnable
(선택 사항): 자막 생성을 활성화할지 여부(기본값: false)
특허
MIT
기여하다
기여를 환영합니다! 풀 리퀘스트를 제출해 주세요.
감사의 말
- AI 모델을 제공하기 위한 Minimax API
- MCP 사양을 위한 모델 컨텍스트 프로토콜
You must be authenticated.
Windsurf 및 Cursor와 같은 편집기에서 AI 기반 이미지 생성 및 텍스트-음성 변환 기능을 제공하기 위해 Minimax API와 통합된 MCP 서버 구현입니다.