Skip to main content
Glama

Minimax MCP Tools

by PsychArch

미니맥스 MCP 도구

미니맥스 MCP 도구 배너

AI 기반 이미지 생성 및 텍스트-음성 변환 기능을 위한 Minimax API 통합을 통한 MCP(모델 컨텍스트 프로토콜) 서버 구현.

특징

  • 이미지 생성 : Minimax의 image-01 모델을 사용하여 텍스트 프롬프트를 기반으로 고품질 이미지를 생성합니다.
  • 텍스트 음성 변환(TTS) : 다양한 음성 옵션, 감정 및 오디오 형식을 사용하여 텍스트를 자연스러운 음성으로 변환합니다.
  • 간편한 통합 : Windsurf 편집기와 MCP 서버로 원활하게 통합됩니다.

설정

필수 조건

  • Node.js 16 이상
  • Minimax API 키( Minimax 플랫폼 에서 획득)
  • TTS 기능을 위한 Minimax 그룹 ID

구성

MCP 구성 파일을 만들거나 업데이트하세요.

  • Windsurf의 경우: ~/.codeium/windsurf/mcp_config.json
  • 커서의 경우: ~/.cursor/config/mcp_config.json

두 편집기 모두 동일한 구성 형식을 사용합니다.

지엑스피1

MCP 인터페이스

이미지 생성

텍스트 프롬프트를 기반으로 이미지 생성:

// Example parameters for image generation { "prompt": "A mountain landscape at sunset", "aspectRatio": "16:9", "n": 1, "outputFile": "/absolute/path/to/image.jpg", "subjectReference": "/path/to/reference.jpg" // Optional: local file or URL }

매개변수:

  • prompt (필수): 생성할 이미지에 대한 설명
  • outputFile (필수): 생성된 이미지 파일을 저장할 절대 경로입니다. 해당 디렉터리는 이미 존재해야 합니다 . 여러 이미지(n>1)를 생성하는 경우, 파일 이름은 순차적인 번호로 지정됩니다(예: 'image-1.jpg', 'image-2.jpg').
  • aspectRatio (선택 사항): 이미지의 종횡비(기본값: "1:1", 옵션: "1:1", "16:9", "4:3", "3:2", "2:3", "3:4", "9:16", "21:9")
  • n (선택 사항): 생성할 이미지 개수(기본값: 1, 범위: 1~9). n>1이면 출력 파일 이름에 자동으로 번호가 매겨집니다.
  • subjectReference (선택 사항): 로컬 이미지 파일 경로 또는 캐릭터 참조용 공개 URL입니다. 이 값을 입력하면 생성된 이미지에서 캐릭터 모양에 대한 참조로 사용됩니다. 지원 형식: JPG, JPEG, PNG

텍스트 음성 변환

다양한 사용자 정의 옵션을 사용하여 텍스트를 음성으로 변환합니다.

// Example parameters for text-to-speech { "text": "Hello, this is a test of the text-to-speech functionality.", "model": "speech-02-hd", "voiceId": "female-shaonv", "speed": 1.0, "volume": 1.0, "pitch": 0, "emotion": "happy", "format": "mp3", "outputFile": "/absolute/path/to/audio.mp3", "subtitleEnable": true }
기본 매개변수:
  • text (필수): 음성으로 변환할 텍스트(최대 10,000자)
  • outputFile (필수): 생성된 오디오 파일을 저장할 절대 경로
  • model (선택 사항): 사용할 모델 버전(기본값: "speech-02-hd", 옵션: "speech-02-hd", "speech-02-turbo")
    • speech-02-hd : 음색 유사성, 리듬 안정성, 스튜디오급 오디오 품질을 갖춘 고화질 모델
    • speech-02-turbo : 뛰어난 성능과 낮은 지연 시간을 갖춘 빠른 모델, 향상된 다국어 기능
  • voiceId (선택 사항): 사용할 음성 ID(기본값: "male-qn-qingse")
  • speed (선택 사항): 음성 속도(기본값: 1.0, 범위: 0.5-2.0)
  • volume (선택 사항): 음성 볼륨(기본값: 1.0, 범위: 0.1-10.0)
  • pitch (선택 사항): 음성 피치(기본값: 0, 범위: -12~12)
  • emotion (선택 사항): 연설의 감정(기본값: "중립", 옵션: "행복", "슬픔", "화남", "두려움", "혐오", "놀람", "중립")
  • timberWeights (선택 사항): 음성 믹싱 설정, 최대 4개의 다른 음성을 가중치로 믹싱할 수 있음
    "timberWeights": [ { "voice_id": "male-qn-qingse", "weight": 70 }, { "voice_id": "female-shaonv", "weight": 30 } ]
오디오 설정:
  • format (선택 사항): 오디오 형식(기본값: "mp3", 옵션: "mp3", "pcm", "flac", "wav")
  • sampleRate (선택 사항): 샘플링 속도(Hz)(기본값: 32000, 옵션: 8000, 16000, 22050, 24000, 32000, 44100)
  • bitrate (선택 사항): MP3 형식의 비트 전송률(기본값: 128000, 옵션: 32000, 64000, 128000, 256000)
  • channel (선택 사항): 오디오 채널 수(기본값: 1, 옵션: 1=모노, 2=스테레오)
고급 기능:
  • latexRead (선택 사항): LaTeX 수식을 읽을지 여부(기본값: false)
  • pronunciationDict (선택 사항): 발음 대체 목록
    "pronunciationDict": ["处理/(chu3)(li3)", "危险/dangerous"]
  • stream (선택 사항): 스트리밍 모드를 사용할지 여부(기본값: false)
  • languageBoost (선택 사항): 특정 언어 인식 향상
    • 옵션: "중국어", "중국어(월어)", "영어", "아랍어", "러시아어", "스페인어", "프랑스어", "포르투갈어", "독일어", "터키어", "네덜란드어", "우크라이나어", "베트남어", "인도네시아어", "일본어", "이탈리아어", "한국어", "태국어", "폴란드어", "루마니아어", "그리스어", "체코어", "핀란드어", "힌디어", "자동"
  • subtitleEnable (선택 사항): 자막 생성을 활성화할지 여부(기본값: false)

특허

MIT

기여하다

기여를 환영합니다! 풀 리퀘스트를 제출해 주세요.

감사의 말

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Windsurf 및 Cursor와 같은 편집기에서 AI 기반 이미지 생성 및 텍스트-음성 변환 기능을 제공하기 위해 Minimax API와 통합된 MCP 서버 구현입니다.

  1. 특징
    1. 설정
      1. 필수 조건
      2. 구성
    2. MCP 인터페이스
      1. 이미지 생성
      2. 텍스트 음성 변환
    3. 특허
      1. 기여하다
        1. 감사의 말

          Related MCP Servers

          • A
            security
            A
            license
            A
            quality
            A MCP server that enables Claude and other MCP-compatible assistants to generate images from text prompts using Together AI's image generation models.
            Last updated -
            1
            2
            TypeScript
            MIT License
            • Apple
            • Linux
          • -
            security
            A
            license
            -
            quality
            A MCP server that integrates with Cursor IDE to generate images based on text descriptions using JiMeng AI, allowing users to create and save custom images directly within their development environment.
            Last updated -
            82
            Python
            MIT License
            • Apple
            • Linux
          • A
            security
            A
            license
            A
            quality
            An MCP Server that integrates with Stability AI's API to provide high-quality image generation, editing, and manipulation capabilities including background removal, outpainting, search-and-replace, and upscaling.
            Last updated -
            13
            35
            55
            TypeScript
            MIT License
            • Apple
          • -
            security
            A
            license
            -
            quality
            An MCP server that connects to Pollinations.ai API, enabling AI models to generate and download images and text through natural language commands.
            Last updated -
            2
            JavaScript
            Apache 2.0
            • Apple
            • Linux

          View all related MCP servers

          MCP directory API

          We provide all the information about MCP servers via our MCP API.

          curl -X GET 'https://glama.ai/api/mcp/v1/servers/PsychArch/minimax-mcp-tools'

          If you have feedback or need assistance with the MCP directory API, please join our Discord server