Integrations
Utilizes .env files for configuration management, particularly for storing API keys and other environment variables.
Uses FastAPI for the HTTP server implementation with SSE transport for connecting to Claude and Cursor.
Uses Pydantic for data validation and settings management within the MCP server implementation.
Resemble AI音声生成MCPサーバー
モデル コンテキスト プロトコル (MCP) を使用してClaudeおよびCursorと統合するResemble AI音声生成 API のサーバー実装。
特徴
- Resemble AIの音声を使用してテキストから音声を生成する
- 利用可能な音声モデルの一覧
- オーディオをローカルファイルまたはbase64でエンコードされた文字列として返します
- 複数の接続方法:
- SSE トランスポート- ネットワークベースのサーバー送信イベント (デフォルト)
- StdIOトランスポート- 直接プロセス通信
セットアップ手順
前提条件
- Python 3.10以上
- Resemble AI APIキー( Resemble AIでサインアップ)
環境設定
オプション 1: Conda を使用する (推奨)
オプション2: 仮想環境の使用
構成
Resemble AI API キーを環境変数として設定します。
または、プロジェクト ルートに次の内容の.env
ファイルを作成します。
サーバーの実行
実行スクリプトの使用(推奨)
希望する実装を選択してください:
CLIを直接使用する
Claudeデスクトップに接続しています
SSEトランスポート接続
claude_desktop_config.json
ファイルを作成します。
StdIOトランスポート接続
claude_desktop_config.json
ファイルを作成します。
カーソルに接続
SSEトランスポート接続
- 設定→AI→MCPサーバーへ移動
- 「サーバーを追加」をクリックします
- 接続タイプとして「SSE」を選択します
- URLを次のように設定します:
http://localhost:8083/sse
StdIOトランスポート接続
- 設定→AI→MCPサーバーへ移動
- 「サーバーを追加」をクリックします
- 接続タイプとして「サブプロセス」を選択します
- コマンドを次のように設定します:
python -m src.cli --implementation stdio
- オプションで環境変数を追加します。
RESEMBLE_API_KEY
: Resemble AI APIキー
利用可能なツール
list_voices
Resemble AI から利用可能な音声モデルを一覧表示します。
generate_tts
テキストから音声オーディオを生成します。
パラメータ:
text
: 音声に変換するテキストvoice_id
: 使用する音声のIDreturn_type
: オーディオを返す方法: 'file' または 'base64' (オプション、デフォルト: 'file')output_filename
: 拡張子なしの出力ファイル名(オプション)
実装の詳細
このプロジェクトにはいくつかの実装が含まれています。
src/resemble_mcp_server.py
: SSEトランスポートでMCP SDKを使用するsrc/resemble_stdio_server.py
: 直接プロセス通信に StdIO トランスポートを使用するsrc/resemble_http_server.py
: SSE を使用した HTTP 実装 (フォールバック)src/resemble_ai_server.py
: 直接API実装src/resemble_ai_sdk_server.py
: 公式 Resemble SDK を使用した実装
トラブルシューティング
MCP SDK インポートエラー
MCP SDK のインポート中に問題が発生した場合、サーバーは自動的に SSE トランスポートを使用した HTTP 実装にフォールバックします。
接続の問題
Claude または Cursor がサーバーに接続できない場合:
- サーバーが稼働していることを確認する
- 正しいURLが設定されていることを確認する
- APIキーが有効であることを確認してください
- サーバーログでエラーを探す
StdIO と SSE トランスポート
- サーバーを別々に、または別のマシンで実行する場合は**、SSEトランスポート**を使用します。
- Claude/Cursor にサーバープロセスを管理させたい場合は、 StdIO トランスポートを使用します。
例
使用例はexamples/
ディレクトリにあります。
📁 リポジトリ構造
🚀 クイックセットアップ
インストールを簡単にするために、次の 2 つのセットアップ スクリプトが提供されています。
Conda の使用 (推奨)
Python venvの使用
どちらのスクリプトでも次のようになります。
- Python 3.10以上の環境を作成する
- 必要な依存関係をすべてインストールする
- テンプレート.envファイルを設定する
- オーディオファイルの出力ディレクトリを作成する
手動インストール
手動で設定する場合:
- Python 3.10 以降の環境を作成します。Copy
- 依存関係をインストールします:Copy
- 環境変数を設定します。Copy
.env
ファイルを編集し、Resemble AI API キーを追加します。オプション: オーディオ出力設定をカスタマイズするCopyCopy - 出力ディレクトリを作成します:Copy
🚀 サーバーの実行
すべての実装をサポートする新しい CLI ツールを使用してサーバーを実行できます。
🔌 カーソルAIとの統合
Cursor は、SSE インターフェースを介して Resemble AI 音声生成サーバーと対話できます。
- カーソルで設定→AI→MCPサーバーへ移動します。
- 「サーバーを追加」をクリックし、SSE URL を入力します:
http://localhost:8083/sse
(必要に応じてポートを調整してください) - 設定を保存する
🔌 Claude Desktopとの統合
- Claude Desktop 設定で MCP サーバーを構成します。Copy
🛠️ ツールのドキュメント
リストの声
Resemble AI から利用可能なすべての音声モデルを一覧表示します。
**パラメータ:**なし
戻り値:
voices
: 利用可能な音声モデルのリスト(ID、名前、性別、言語、アクセント、説明付き)
生成TTS
テキストから音声オーディオを生成します。
パラメータ:
text
(文字列、必須): 音声に変換するテキストvoice_id
(文字列、必須): 使用する音声のIDreturn_type
(文字列、オプション): オーディオを返す方法: 'file' または 'base64' (デフォルト: 'file')output_filename
(文字列、オプション): 拡張子なしの出力ファイル名 (デフォルト: 自動生成された名前)
戻り値:
success
(ブール値): 操作が成功したかどうかmessage
(文字列): ステータスメッセージaudio_data
(文字列、オプション): Base64でエンコードされたオーディオデータ(return_typeが 'base64'の場合)file_path
(文字列、オプション): 保存されたオーディオファイルへのパス (return_type が 'file' の場合)
💬 プロンプトの例
Cursor または Claude Desktop に接続すると、次のようなプロンプトを使用できます。
利用可能な音声の一覧:
音声オーディオの生成:
⚠️ トラブルシューティング
- Pythonバージョンの問題:MCPパッケージにはPython 3.10以降が必要です。提供されているセットアップスクリプトを使用して適切な環境を構築してください。
- API接続の問題:正しいAPIエンドポイントを使用していることを確認してください。Resemble AI APIエンドポイントは
https://app.resemble.ai/api/v2/
です。 - 認証エラー: API キーが正しく、期限切れでないことを確認してください。
- プロジェクトが不足しています:APIを使用するには、Resembleアカウントに少なくとも1つのプロジェクトが必要です。必要に応じて、Resemble AIダッシュボードからプロジェクトを作成してください。
- カーソル SSE 接続エラー: カーソルが SSE 経由で接続できない場合は、次の点を確認してください。
- サーバーは指定されたポートで実行されています
- 正しい
/sse
エンドポイントを使用しています - ファイアウォールが接続をブロックしていない
- サーバーとカーソルの両方を再起動してみてください
📚 追加ドキュメント
より詳細なドキュメントについては、 docs/
ディレクトリ内のファイルを参照してください。
📄 ライセンス
マサチューセッツ工科大学
This server cannot be installed
モデル コンテキスト プロトコルを使用して Claude および Cursor と統合し、Resemble AI の音声を使用してテキストから音声オーディオを生成します。
- Features
- Setup Instructions
- Running the Server
- Connecting to Claude Desktop
- Connecting to Cursor
- Available Tools
- Implementation Details
- Troubleshooting
- Examples
- 📁 Repository Structure
- 🚀 Quick Setup
- Manual Installation
- 🚀 Running the Server
- 🔌 Integrating with Cursor AI
- 🔌 Integrating with Claude Desktop
- 🛠️ Tool Documentation
- 💬 Example Prompts
- ⚠️ Troubleshooting
- 📚 Additional Documentation
- 📄 License