Minimax MCP Tools

by PsychArch
Verified

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Integrations

  • Supports reading LaTeX formulas in text-to-speech functionality with configurable options for pronunciation.

  • Required as a runtime environment for the MCP server with version 16 or higher needed as a prerequisite.

미니맥스 MCP 도구

AI 기반 이미지 생성 및 텍스트-음성 변환 기능을 위한 Minimax API 통합을 통한 MCP(모델 컨텍스트 프로토콜) 서버 구현.

특징

  • 이미지 생성 : Minimax의 image-01 모델을 사용하여 텍스트 프롬프트를 기반으로 고품질 이미지를 생성합니다.
  • 텍스트 음성 변환(TTS) : 다양한 음성 옵션, 감정 및 오디오 형식을 사용하여 텍스트를 자연스러운 음성으로 변환합니다.
  • 간편한 통합 : Windsurf 편집기와 MCP 서버로 원활하게 통합됩니다.

설정

필수 조건

  • Node.js 16 이상
  • Minimax API 키( Minimax 플랫폼 에서 획득)
  • TTS 기능을 위한 Minimax 그룹 ID

구성

MCP 구성 파일을 만들거나 업데이트하세요.

  • Windsurf의 경우: ~/.codeium/windsurf/mcp_config.json
  • 커서의 경우: ~/.cursor/config/mcp_config.json

두 편집기 모두 동일한 구성 형식을 사용합니다.

지엑스피1

MCP 인터페이스

이미지 생성

텍스트 프롬프트를 기반으로 이미지 생성:

// Example parameters for image generation { "prompt": "A mountain landscape at sunset", "aspectRatio": "16:9", "n": 1, "outputFile": "/absolute/path/to/image.jpg", "subjectReference": "/path/to/reference.jpg" // Optional: local file or URL }

매개변수:

  • prompt (필수): 생성할 이미지에 대한 설명
  • outputFile (필수): 생성된 이미지 파일을 저장할 절대 경로입니다. 해당 디렉터리는 이미 존재해야 합니다 . 여러 이미지(n>1)를 생성하는 경우, 파일 이름은 순차적인 번호로 지정됩니다(예: 'image-1.jpg', 'image-2.jpg').
  • aspectRatio (선택 사항): 이미지의 종횡비(기본값: "1:1", 옵션: "1:1", "16:9", "4:3", "3:2", "2:3", "3:4", "9:16", "21:9")
  • n (선택 사항): 생성할 이미지 개수(기본값: 1, 범위: 1~9). n>1이면 출력 파일 이름에 자동으로 번호가 매겨집니다.
  • subjectReference (선택 사항): 로컬 이미지 파일 경로 또는 캐릭터 참조용 공개 URL입니다. 이 값을 입력하면 생성된 이미지에서 캐릭터 모양에 대한 참조로 사용됩니다. 지원 형식: JPG, JPEG, PNG

텍스트 음성 변환

다양한 사용자 정의 옵션을 사용하여 텍스트를 음성으로 변환합니다.

// Example parameters for text-to-speech { "text": "Hello, this is a test of the text-to-speech functionality.", "model": "speech-02-hd", "voiceId": "female-shaonv", "speed": 1.0, "volume": 1.0, "pitch": 0, "emotion": "happy", "format": "mp3", "outputFile": "/absolute/path/to/audio.mp3", "subtitleEnable": true }

기본 매개변수:

  • text (필수): 음성으로 변환할 텍스트(최대 10,000자)
  • outputFile (필수): 생성된 오디오 파일을 저장할 절대 경로
  • model (선택 사항): 사용할 모델 버전(기본값: "speech-02-hd", 옵션: "speech-02-hd", "speech-02-turbo")
    • speech-02-hd : 음색 유사성, 리듬 안정성, 스튜디오급 오디오 품질을 갖춘 고화질 모델
    • speech-02-turbo : 뛰어난 성능과 낮은 지연 시간을 갖춘 빠른 모델, 향상된 다국어 기능
  • voiceId (선택 사항): 사용할 음성 ID(기본값: "male-qn-qingse")
  • speed (선택 사항): 음성 속도(기본값: 1.0, 범위: 0.5-2.0)
  • volume (선택 사항): 음성 볼륨(기본값: 1.0, 범위: 0.1-10.0)
  • pitch (선택 사항): 음성 피치(기본값: 0, 범위: -12~12)
  • emotion (선택 사항): 연설의 감정(기본값: "중립", 옵션: "행복", "슬픔", "화남", "두려움", "혐오", "놀람", "중립")
  • timberWeights (선택 사항): 음성 믹싱 설정, 최대 4개의 다른 음성을 가중치로 믹싱할 수 있음
    "timberWeights": [ { "voice_id": "male-qn-qingse", "weight": 70 }, { "voice_id": "female-shaonv", "weight": 30 } ]

오디오 설정:

  • format (선택 사항): 오디오 형식(기본값: "mp3", 옵션: "mp3", "pcm", "flac", "wav")
  • sampleRate (선택 사항): 샘플링 속도(Hz)(기본값: 32000, 옵션: 8000, 16000, 22050, 24000, 32000, 44100)
  • bitrate (선택 사항): MP3 형식의 비트 전송률(기본값: 128000, 옵션: 32000, 64000, 128000, 256000)
  • channel (선택 사항): 오디오 채널 수(기본값: 1, 옵션: 1=모노, 2=스테레오)

고급 기능:

  • latexRead (선택 사항): LaTeX 수식을 읽을지 여부(기본값: false)
  • pronunciationDict (선택 사항): 발음 대체 목록
    "pronunciationDict": ["处理/(chu3)(li3)", "危险/dangerous"]
  • stream (선택 사항): 스트리밍 모드를 사용할지 여부(기본값: false)
  • languageBoost (선택 사항): 특정 언어 인식 향상
    • 옵션: "중국어", "중국어(월어)", "영어", "아랍어", "러시아어", "스페인어", "프랑스어", "포르투갈어", "독일어", "터키어", "네덜란드어", "우크라이나어", "베트남어", "인도네시아어", "일본어", "이탈리아어", "한국어", "태국어", "폴란드어", "루마니아어", "그리스어", "체코어", "핀란드어", "힌디어", "자동"
  • subtitleEnable (선택 사항): 자막 생성을 활성화할지 여부(기본값: false)

특허

MIT

기여하다

기여를 환영합니다! 풀 리퀘스트를 제출해 주세요.

감사의 말

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Windsurf 및 Cursor와 같은 편집기에서 AI 기반 이미지 생성 및 텍스트-음성 변환 기능을 제공하기 위해 Minimax API와 통합된 MCP 서버 구현입니다.

  1. Features
    1. Setup
      1. Prerequisites
      2. Configuration
    2. MCP Interface
      1. Image Generation
      2. Text-to-Speech
    3. License
      1. Contributing
        1. Acknowledgements
          ID: urpa6fr1dl