ミニマックス MCP JS
MiniMax MCP の JavaScript/TypeScript 実装。画像生成、ビデオ生成、テキスト読み上げなどの機能を提供します。
ドキュメント
- 中国語の文書
- Python バージョン- MiniMax MCP の公式 Python 実装
特徴
- テキスト読み上げ(TTS)
- 画像生成
- ビデオ生成
- 音声クローン
- 動的構成(環境変数とリクエストパラメータの両方をサポート)
- MCP プラットフォーム ホスティング (ModelScope およびその他の MCP プラットフォーム) と互換性があります
インストール
クイックスタート
MiniMax MCP JS は、モデル コンテキスト プロトコル (MCP)仕様を実装しており、MCP 互換クライアント (Claude AI など) と対話するためのサーバーとして使用できます。
MCP クライアントのクイックスタート
- MiniMax International Platformから API キーを取得します。
- Node.jsとnpmがすでにインストールされていることを確認してください
- 重要: API HOST&KEY はリージョンごとに異なります。一致する必要があります。一致しない場合は、
Invalid API key
エラーが発生します。
地域 | グローバル | 本土 |
---|---|---|
MINIMAX_API_KEY | MiniMax Globalから入手する | MiniMaxから入手する |
MINIMAX_API_HOST | https://api.minimaxi.chat (余分な**「i」**に注意してください) | https://api.minimax.chat |
MCP クライアントでの使用 (推奨)
MCP クライアントを構成します。
クロードデスクトップ
Claude > Settings > Developer > Edit Config > claude_desktop_config.json
に移動して、以下を追加します。
カーソル
上記の設定を追加するには、 Cursor → Preferences → Cursor Settings → MCP → Add new global MCP Server
に移動します。
⚠️注意:MiniMax MCP JSをCursorと組み合わせて使用する際に「ツールが見つかりません」というエラーが発生する場合は、Cursorを最新バージョンに更新してください。詳細については、こちらのディスカッションスレッドをご覧ください。
これで完了です。MCP クライアントはこれらのツールを通じて MiniMax とやり取りできるようになりました。
ローカル開発の場合: ローカルで開発する場合は、 npm link
を使用して変更をテストできます。
次に、上記のようにClaude DesktopまたはCursorでnpxを使用するように設定します。これにより、リンクされたバージョンが自動的に使用されます。
⚠️注意:APIキーはホストアドレスと一致する必要があります。グローバル版と中国本土版では異なるホストが使用されます。
- グローバルホスト:
https://api.minimaxi.chat
(余分な「i」に注意してください) - 中国本土ホスト:
https://api.minimaxi.chat
輸送モード
MiniMax MCP JS は、次の 3 つのトランスポート モードをサポートしています。
特徴 | stdio(デフォルト) | 休む | 南南東 |
---|---|---|---|
環境 | ローカルのみ | ローカルまたはクラウド展開 | ローカルまたはクラウド展開 |
コミュニケーション | standard I/O 経由 | HTTP requests 経由 | server-sent events 経由 |
ユースケース | ローカルMCPクライアント統合 | APIサービス、言語間呼び出し | サーバープッシュを必要とするアプリケーション |
入力制限 | local files またはURL リソースをサポート | クラウドに展開する場合はURL 入力を推奨 | クラウドに展開する場合はURL 入力を推奨 |
構成
MiniMax-MCP-JSは、さまざまなユースケースに適応できるよう、複数の柔軟な設定方法を提供しています。設定の優先順位は、高いものから低いものの順で以下のとおりです。
1. リクエストパラメータの設定(最優先)
プラットフォーム ホスティング環境 (ModelScope やその他の MCP プラットフォームなど) では、リクエスト パラメータのmeta.auth
オブジェクトを介して、リクエストごとに独立した構成を提供できます。
この方法により、マルチテナントの使用が可能になり、各リクエストで異なる API キーと構成を使用できるようになります。
2. API設定
他のプロジェクトのモジュールとして使用する場合は、 startMiniMaxMCP
関数を通じて構成を渡すことができます。
3. コマンドライン引数
- CLI ツールをグローバルにインストールします。
- CLI ツールとして使用する場合は、コマンドライン引数を使用して構成を指定できます。
4. 環境変数(最低優先度)
最も基本的な設定方法は環境変数を使用することです。
構成の優先順位
複数の構成方法を使用する場合、次の優先順位が適用されます (最高から最低の順)。
- リクエストレベルの構成(各 API リクエストの
meta.auth
経由) - コマンドライン引数
- 環境変数
- 設定ファイル
- デフォルト値
この優先順位付けにより、マルチテナント環境のリクエストごとの構成機能を維持しながら、さまざまな展開シナリオにわたる柔軟性が確保されます。
構成パラメータ
パラメータ | 説明 | デフォルト値 |
---|---|---|
apiキー | MiniMax APIキー | なし(必須) |
apiホスト | MiniMax APIホスト | グローバルホスト - https://api.minimaxi.chat 、本土ホスト - https://api.minimax.chat |
ベースパス | 出力ファイルのベースパス | ユーザーのデスクトップ |
リソースモード | リソース処理モード、「url」または「local」 | URL |
⚠️注意:APIキーはホストアドレスと一致する必要があります。グローバル版と中国本土版では異なるホストが使用されます。
- グローバルホスト:
https://api.minimaxi.chat
(余分な「i」に注意してください) - 中国本土ホスト:
https://api.minimax.chat
使用例
⚠️ 警告: これらのツールを使用すると費用が発生する場合があります。
1.夕方のニュースの一部を放送する
2. 声を複製する
3. ビデオを生成する
4. 画像を生成する
利用可能なツール
テキストから音声へ
テキストを音声オーディオファイルに変換します。
ツール名: text_to_audio
パラメータ:
text
: 変換するテキスト(必須)model
: モデルバージョン。オプションは「speech-02-hd」、「speech-02-turbo」、「speech-01-hd」、「speech-01-turbo」、「speech-01-240228」、「speech-01-turbo-240228」、デフォルトは「speech-02-hd」voiceId
: 音声ID、デフォルトは「male-qn-qingse」speed
: 音声速度、範囲は 0.5~2.0、デフォルトは 1.0vol
: 音量、範囲は 0.1~10.0、デフォルトは 1.0pitch
: ピッチ、範囲は -12 から 12、デフォルトは 0emotion
:感情。選択肢は「幸せ」「悲しい」「怒り」「恐れ」「嫌悪」「驚き」「中立」で、デフォルトは「幸せ」です。注:このパラメータは「speech-02-hd」「speech-02-turbo」「speech-01-turbo」「speech-01-hd」モデルでのみ機能します。format
: オーディオフォーマット。オプションは「mp3」、「pcm」、「flac」、「wav」、デフォルトは「mp3」sampleRate
: サンプルレート (Hz)、オプションは 8000、16000、22050、24000、32000、44100、デフォルトは 32000bitrate
: ビットレート (bps)、オプションは 64000、96000、128000、160000、192000、224000、256000、320000、デフォルトは 128000channel
: オーディオチャンネル。オプションは1または2、デフォルトは1languageBoost
: 言語ブースト、デフォルトは「自動」latexRead
: LaTeXの数式の読み取りを有効にするpronunciationDict
: 発音辞書stream
: ストリーミング出力を有効にするsubtitleEnable
: 字幕生成を有効にするoutputDirectory
: 出力ファイルを保存するディレクトリ(オプション)outputFile
: 出力ファイルを保存するパス(オプション、指定されていない場合は自動生成されます)
音声を再生
オーディオファイルを再生します。WAVおよびMP3形式をサポートします。ビデオはサポートしていません。
ツール名: play_audio
パラメータ:
inputFilePath
: 再生するオーディオファイルへのパス(必須)isUrl
: オーディオファイルがURLかどうか。デフォルトはfalse
ボイスクローン
オーディオ ファイルから音声を複製します。
ツール名: voice_clone
パラメータ:
audioFile
: オーディオファイルへのパス(必須)voiceId
: 音声ID(必須)text
: デモ音声のテキスト(オプション)outputDirectory
: 出力ファイルを保存するディレクトリ(オプション)
テキストから画像へ
テキストプロンプトに基づいて画像を生成します。
ツール名: text_to_image
パラメータ:
prompt
: 画像の説明(必須)model
: モデルバージョン、デフォルトは 'image-01'aspectRatio
: アスペクト比。デフォルトは「1:1」、オプションは「1:1」、「16:9」、「4:3」、「3:2」、「2:3」、「3:4」、「9:16」、「21:9」n
: 生成する画像の数、範囲は1~9、デフォルトは1promptOptimizer
: プロンプトを最適化するかどうか。デフォルトは truesubjectReference
: 文字参照用のローカル画像ファイルまたはパブリック URL へのパス (オプション)outputDirectory
: 出力ファイルを保存するディレクトリ(オプション)outputFile
: 出力ファイルを保存するパス(オプション、指定されていない場合は自動生成されます)asyncMode
: 非同期モードを使用するかどうか。デフォルトはFalseです。Trueの場合、ビデオ生成タスクは非同期で送信され、レスポンスとしてtask_idが返されます。タスクのステータスを確認し、結果を取得するには、query_video_generation
ツールを使用する必要があります。(オプション)
ビデオを生成する
テキストプロンプトに基づいてビデオを生成します。
ツール名: generate_video
パラメータ:
prompt
: ビデオの説明 (必須)model
: モデルバージョン。オプションは「T2V-01」、「T2V-01-Director」、「I2V-01」、「I2V-01-Director」、「I2V-01-live」、「S2V-01」、デフォルトは「T2V-01」firstFrameImage
: 最初のフレーム画像へのパス(オプション)outputDirectory
: 出力ファイルを保存するディレクトリ(オプション)outputFile
: 出力ファイルを保存するパス(オプション、指定されていない場合は自動生成されます)asyncMode
: 非同期モードを使用するかどうか。デフォルトはFalseです。Trueの場合、ビデオ生成タスクは非同期で送信され、レスポンスとしてtask_idが返されます。タスクのステータスを確認し、結果を取得するには、query_video_generation
ツールを使用する必要があります。(オプション)
ビデオ生成ステータスのクエリ
ビデオ生成タスクのステータスを照会します。
ツール名: query_video_generation
パラメータ:
taskId
: クエリするタスクID。async_modeasync_mode
Trueの場合、generate_video
ツールによって返されるtask_idである必要があります。(必須)outputDirectory
: 出力ファイルを保存するディレクトリ(オプション)
よくある質問
1. 非同期モードでgenerate_video
使用する方法
開始する前に補完ルールを定義します。または、これらのルールは IDE 設定 (カーソルなど) で構成できます。
発達
設定
建てる
走る
ライセンス
マサチューセッツ工科大学
You must be authenticated.
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
MiniMax MCP の JavaScript 実装。MCP 互換クライアントを介して、画像生成、ビデオ生成、テキスト読み上げ、音声複製のための MiniMax AI サービスとの対話を可能にします。
Related MCP Servers
- AsecurityAlicenseAqualityA MCP server that enables Claude and other MCP-compatible assistants to generate images from text prompts using Together AI's image generation models.Last updated -12TypeScriptMIT License
- AsecurityAlicenseAqualityAn MCP server implementation that integrates with Minimax API to provide AI-powered image generation and text-to-speech functionality in editors like Windsurf and Cursor.Last updated -21921JavaScriptMIT License
ElevenLabs MCP Serverofficial
AsecurityAlicenseAqualityAn official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.Last updated -19700PythonMIT LicenseMiniMax MCP Serverofficial
AsecurityAlicenseAqualityEnables MCP clients like Claude Desktop and Cursor to interact with MiniMax APIs for generating speech, cloning voices, creating videos, and generating images.Last updated -6381PythonMIT License