📢 ブラバーMCP 🗣️
OpenAI の Text-to-Speech API を使用して LLM に音声を与える MCP サーバーです。🔊
✨ 特徴
- **テキスト読み上げ:**入力テキストを高品質の音声に変換します。
- **音声選択:**さまざまな OpenAI 音声 (
alloy
、echo
、fable
、onyx
、nova
、shimmer
) から選択します。 - **モデルの選択:**標準 (
tts-1
) または高解像度 (tts-1-hd
) モデルを使用します。 - フォーマットオプション:
mp3
、opus
、aac
、またはflac
でオーディオ出力を取得します。 - **ファイルの保存:**生成されたオーディオをローカル ファイルに保存します。
- **オプションの再生:**構成可能なシステム コマンドを使用して、生成されたオーディオを自動的に再生します。
- **設定可能なデフォルト:**設定によってデフォルトの音声を設定します。
🔧 構成
このサーバーを使用するには、MCP クライアントの設定ファイル (例: mcp_settings.json
) にその構成を追加する必要があります。
- OpenAI API キーを取得します。OpenAIからの API キーが必要です。
- **MCP 設定に追加:**設定ファイルの
mcpServers
オブジェクトに次のブロックを追加し、"YOUR_OPENAI_API_KEY"
を実際のキーに置き換えます。
重要: args
パスがblabber-mcp
プロジェクトディレクトリ内のbuild/index.js
ファイルの正しい場所を指していることを確認してください。完全な絶対パスを使用してください。
🚀 使用方法
設定して実行すると、MCP クライアント経由でtext_to_speech
ツールを使用できるようになります。
ツール: text_to_speech
サーバー: blabber-mcp
(または設定で使用したキー)
引数:
input
(文字列、必須): 合成するテキスト。voice
(文字列、オプション): 使用する音声(alloy
、echo
、fable
、onyx
、nova
、shimmer
)。デフォルトは設定で設定されたDEFAULT_TTS_VOICE
、またはnova
。model
(文字列, オプション): モデル (tts-1
、tts-1-hd
)。デフォルトはtts-1
です。response_format
(文字列、オプション): オーディオ形式 (mp3
、opus
、aac
、flac
)。デフォルトはmp3
です。play
(boolean, オプション):true
に設定すると、保存後にオーディオが自動的に再生されます。デフォルトはfalse
です。
ツール呼び出しの例 (再生付き):
出力:
このツールは、オーディオ ファイルをblabber-mcp
プロジェクト フォルダー内のoutput/
ディレクトリに保存し、次のような JSON 応答を返します。
📜 ライセンス
このプロジェクトは MIT ライセンスに基づいてライセンスされています - 詳細についてはLICENSEファイルを参照してください。
🕒 変更履歴
バージョン履歴の詳細については、 CHANGELOG.mdファイルを参照してください。
Related MCP Servers
- AsecurityAlicenseAqualityA MCP server that enables transcription of audio files using OpenAI's Speech-to-Text API, with support for multiple languages and file saving options.Last updated -12JavaScriptMIT License
ElevenLabs MCP Serverofficial
AsecurityAlicenseAqualityAn official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.Last updated -19700PythonMIT License- -security-license-qualityAn MCP server that enables LLMs to access the NijiVoice API for text-to-speech generation, supporting features like fetching available voice actors and checking credit balance.Last updated -1PythonMIT License
- -securityFlicense-qualityAn MCP server that downloads videos/extracts audio from various platforms like YouTube, Bilibili, and TikTok, then transcribes them to text using OpenAI's Whisper model.Last updated -2Python