미니맥스 MCP JS
MiniMax MCP의 JavaScript/TypeScript 구현으로, 이미지 생성, 비디오 생성, 텍스트 음성 변환 등의 기능을 제공합니다.
선적 서류 비치
특징
- 텍스트 음성 변환(TTS)
- 이미지 생성
- 비디오 생성
- 음성 복제
- 동적 구성(환경 변수와 요청 매개변수 모두 지원)
- MCP 플랫폼 호스팅(ModelScope 및 기타 MCP 플랫폼)과 호환 가능
설치
지엑스피1
빠른 시작
MiniMax MCP JS는 MCP(Model Context Protocol) 사양을 구현하고 MCP 호환 클라이언트(예: Claude AI)와 상호 작용하기 위한 서버로 사용될 수 있습니다.
MCP 클라이언트를 사용한 빠른 시작
- MiniMax International Platform 에서 API 키를 받으세요.
- Node.js와 npm이 이미 설치되어 있는지 확인하세요.
- 중요: API 호스트 및 키는 지역마다 다르 므로 일치해야 합니다. 그렇지 않으면
Invalid API key
오류가 발생합니다.
지역 | 글로벌 | 본토 |
---|---|---|
최소 API 키 | MiniMax Global 에서 받으세요 | 미니맥스 에서 가다 |
최소 API 호스트 | https://api.minimaxi.chat (추가 "i" 에 주의하세요) | https://api.minimax.chat |
MCP 클라이언트와 함께 사용(권장)
MCP 클라이언트를 구성하세요.
클로드 데스크탑
Claude > Settings > Developer > Edit Config > claude_desktop_config.json
으로 이동하여 다음을 포함합니다.
커서
Cursor → Preferences → Cursor Settings → MCP → Add new global MCP Server
로 이동하여 위의 구성을 추가합니다.
⚠️ 참고 : MiniMax MCP JS를 Cursor와 함께 사용할 때 "도구를 찾을 수 없습니다" 오류가 발생하는 경우, Cursor를 최신 버전으로 업데이트하세요. 자세한 내용은 이 토론 스레드를 참조하세요.
이제 MCP 클라이언트가 이러한 도구를 통해 MiniMax와 상호 작용할 수 있습니다.
로컬 개발의 경우 : 로컬에서 개발할 때 npm link
사용하여 변경 사항을 테스트할 수 있습니다.
그런 다음 위에 표시된 것처럼 Claude Desktop 또는 Cursor가 npx를 사용하도록 설정하세요. 이렇게 하면 연결된 버전이 자동으로 사용됩니다.
⚠️ 참고 : API 키는 호스트 주소와 일치해야 합니다. 글로벌 버전과 중국 본토 버전은 서로 다른 호스트를 사용합니다.
- 글로벌 호스트:
https://api.minimaxi.chat
(추가 "i"에 주의하세요) - 중국 본토 호스트:
https://api.minimaxi.chat
운송 모드
MiniMax MCP JS는 세 가지 전송 모드를 지원합니다.
특징 | stdio(기본값) | 나머지 | 남남동 |
---|---|---|---|
환경 | 로컬만 | 로컬 또는 클라우드 배포 | 로컬 또는 클라우드 배포 |
의사소통 | standard I/O 통해 | HTTP requests 통해 | server-sent events 통해 |
사용 사례 | 로컬 MCP 클라이언트 통합 | API 서비스, 교차 언어 호출 | 서버 푸시가 필요한 애플리케이션 |
입력 제한 | local files 또는 URL 리소스를 지원합니다. | 클라우드에 배포하는 경우 URL 입력 권장 | 클라우드에 배포하는 경우 URL 입력 권장 |
구성
MiniMax-MCP-JS는 다양한 사용 사례에 맞춰 유연하게 구성할 수 있는 여러 가지 구성 방법을 제공합니다. 구성 우선순위는 다음과 같습니다(가장 높은 것부터 가장 낮은 것 순).
1. 요청 매개변수 구성(가장 높은 우선순위)
플랫폼 호스팅 환경(ModelScope 또는 기타 MCP 플랫폼 등)에서는 요청 매개변수의 meta.auth
객체를 통해 각 요청에 대해 독립적인 구성을 제공할 수 있습니다.
이 방법을 사용하면 각 요청에서 서로 다른 API 키와 구성을 사용할 수 있는 다중 테넌트 사용이 가능합니다.
2. API 구성
다른 프로젝트에서 모듈로 사용하는 경우 startMiniMaxMCP
함수를 통해 구성을 전달할 수 있습니다.
3. 명령줄 인수
- CLI 도구를 전역적으로 설치합니다.
- CLI 도구로 사용하는 경우 명령줄 인수를 통해 구성을 제공할 수 있습니다.
4. 환경 변수(가장 낮은 우선순위)
가장 기본적인 구성 방법은 환경 변수를 사용하는 것입니다.
구성 우선 순위
여러 구성 방법을 사용하는 경우 다음 우선순위가 적용됩니다(가장 높은 것부터 가장 낮은 것까지):
- 요청 수준 구성 (각 API 요청의
meta.auth
를 통해) - 명령줄 인수
- 환경 변수
- 구성 파일
- 기본값
이러한 우선순위 지정을 통해 다중 테넌트 환경에 대한 요청별 구성 기능을 유지하는 동시에 다양한 배포 시나리오에서 유연성을 확보할 수 있습니다.
구성 매개변수
매개변수 | 설명 | 기본값 |
---|---|---|
API 키 | 미니맥스 API 키 | 없음 (필수) |
api호스트 | MiniMax API 호스트 | 글로벌 호스트 - https://api.minimaxi.chat , 중국 본토 호스트 - https://api.minimax.chat |
기본 경로 | 출력 파일의 기본 경로 | 사용자의 데스크톱 |
리소스모드 | 리소스 처리 모드, 'url' 또는 'local' | URL |
⚠️ 참고 : API 키는 호스트 주소와 일치해야 합니다. 글로벌 버전과 중국 본토 버전은 서로 다른 호스트를 사용합니다.
- 글로벌 호스트:
https://api.minimaxi.chat
(추가 "i"에 주의하세요) - 중국 본토 호스트:
https://api.minimax.chat
사용 예
⚠️ 경고: 이 도구를 사용하면 비용이 발생할 수 있습니다.
1. 저녁 뉴스의 일부를 방송하다
2. 음성 복제
3. 비디오 생성
4. 이미지 생성
사용 가능한 도구
텍스트를 오디오로
텍스트를 음성 오디오 파일로 변환합니다.
도구 이름: text_to_audio
매개변수:
text
: 변환할 텍스트 (필수)model
: 모델 버전, 옵션은 'speech-02-hd', 'speech-02-turbo', 'speech-01-hd', 'speech-01-turbo', 'speech-01-240228', 'speech-01-turbo-240228'이며, 기본값은 'speech-02-hd'입니다.voiceId
: 음성 ID, 기본값은 'male-qn-qingse'입니다.speed
: 음성 속도, 범위 0.5-2.0, 기본값은 1.0vol
: 볼륨, 범위 0.1-10.0, 기본값은 1.0입니다.pitch
: 피치, 범위 -12 ~ 12, 기본값은 0입니다.emotion
: 감정, 옵션은 '행복', '슬픔', '화남', '두려움', '혐오', '놀람', '중립'이며, 기본값은 '행복'입니다. 참고: 이 매개변수는 'speech-02-hd', 'speech-02-turbo', 'speech-01-turbo', 'speech-01-hd' 모델에서만 작동합니다.format
: 오디오 형식, 옵션은 'mp3', 'pcm', 'flac', 'wav'이며 기본값은 'mp3'입니다.sampleRate
: 샘플 속도(Hz), 옵션은 8000, 16000, 22050, 24000, 32000, 44100이며 기본값은 32000입니다.bitrate
: 비트 전송률(bps), 옵션은 64000, 96000, 128000, 160000, 192000, 224000, 256000, 320000이며 기본값은 128000입니다.channel
: 오디오 채널, 옵션은 1 또는 2이며 기본값은 1입니다.languageBoost
: 언어 강화, 기본값은 '자동'입니다.latexRead
: LaTeX 수식 읽기 활성화pronunciationDict
: 발음 사전stream
: 스트리밍 출력 활성화subtitleEnable
: 자막 생성 활성화outputDirectory
: 출력 파일을 저장할 디렉토리(선택 사항)outputFile
: 출력 파일을 저장할 경로(선택 사항, 지정하지 않으면 자동 생성됨)
오디오 재생
오디오 파일을 재생합니다. WAV 및 MP3 형식을 지원합니다. 비디오는 지원하지 않습니다.
도구 이름: play_audio
매개변수:
inputFilePath
: 재생할 오디오 파일의 경로(필수)isUrl
: 오디오 파일이 URL인지 여부, 기본값은 false입니다.
음성 복제
오디오 파일에서 음성을 복제합니다.
도구 이름: voice_clone
매개변수:
audioFile
: 오디오 파일 경로(필수)voiceId
: 음성 ID (필수)text
: 데모 오디오용 텍스트(선택 사항)outputDirectory
: 출력 파일을 저장할 디렉토리(선택 사항)
텍스트를 이미지로
텍스트 프롬프트를 기반으로 이미지를 생성합니다.
도구 이름: text_to_image
매개변수:
prompt
: 이미지 설명 (필수)model
: 모델 버전, 기본값은 'image-01'입니다.aspectRatio
: 종횡비, 기본값은 '1:1'이고 옵션은 '1:1', '16:9', '4:3', '3:2', '2:3', '3:4', '9:16', '21:9'입니다.n
: 생성할 이미지 수, 범위 1-9, 기본값은 1입니다.promptOptimizer
: 프롬프트를 최적화할지 여부, 기본값은 truesubjectReference
: 로컬 이미지 파일 경로 또는 문자 참조용 공개 URL(선택 사항)outputDirectory
: 출력 파일을 저장할 디렉토리(선택 사항)outputFile
: 출력 파일을 저장할 경로(선택 사항, 지정하지 않으면 자동 생성됨)asyncMode
: 비동기 모드 사용 여부입니다. 기본값은 False입니다. True인 경우 비디오 생성 작업이 비동기적으로 전송되고 응답에서 task_id가 반환됩니다.query_video_generation
도구를 사용하여 작업 상태를 확인하고 결과를 가져와야 합니다. (선택 사항)
비디오 생성
텍스트 프롬프트를 기반으로 비디오를 생성합니다.
도구 이름: generate_video
매개변수:
prompt
: 비디오 설명(필수)model
: 모델 버전, 옵션은 'T2V-01', 'T2V-01-Director', 'I2V-01', 'I2V-01-Director', 'I2V-01-live', 'S2V-01'이며 기본값은 'T2V-01'입니다.firstFrameImage
: 첫 번째 프레임 이미지 경로(선택 사항)outputDirectory
: 출력 파일을 저장할 디렉토리(선택 사항)outputFile
: 출력 파일을 저장할 경로(선택 사항, 지정하지 않으면 자동 생성됨)asyncMode
: 비동기 모드 사용 여부입니다. 기본값은 False입니다. True인 경우 비디오 생성 작업이 비동기적으로 전송되고 응답에서 task_id가 반환됩니다.query_video_generation
도구를 사용하여 작업 상태를 확인하고 결과를 가져와야 합니다. (선택 사항)
비디오 생성 상태 쿼리
비디오 생성 작업의 상태를 쿼리합니다.
도구 이름: query_video_generation
매개변수:
taskId
: 쿼리할 작업 ID입니다.async_mode
가 True인 경우generate_video
도구에서 반환된 task_id여야 합니다. (필수)outputDirectory
: 출력 파일을 저장할 디렉토리(선택 사항)
자주 묻는 질문
1. 비동기 모드에서 generate_video
사용하는 방법
시작하기 전에 완료 규칙을 정의하세요. 또는 IDE 설정(예: 커서)에서 이러한 규칙을 구성할 수 있습니다.
개발
설정
짓다
달리다
특허
MIT
You must be authenticated.
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
MCP 호환 클라이언트를 통해 이미지 생성, 비디오 생성, 텍스트 음성 변환, 음성 복제를 위한 MiniMax AI 서비스와의 상호작용을 가능하게 하는 MiniMax MCP의 JavaScript 구현입니다.
Related MCP Servers
- AsecurityAlicenseAqualityA MCP server that enables Claude and other MCP-compatible assistants to generate images from text prompts using Together AI's image generation models.Last updated -12TypeScriptMIT License
- AsecurityAlicenseAqualityAn MCP server implementation that integrates with Minimax API to provide AI-powered image generation and text-to-speech functionality in editors like Windsurf and Cursor.Last updated -21921JavaScriptMIT License
ElevenLabs MCP Serverofficial
AsecurityAlicenseAqualityAn official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.Last updated -19700PythonMIT LicenseMiniMax MCP Serverofficial
AsecurityAlicenseAqualityEnables MCP clients like Claude Desktop and Cursor to interact with MiniMax APIs for generating speech, cloning voices, creating videos, and generating images.Last updated -6381PythonMIT License