AivisSpeech MCP サーバー
AivisSpeech用のModel Context Protocol (MCP) サーバーの実装です。このサーバーは、AivisSpeech Engineと連携して、音声合成のためのインターフェースを提供します。MCPプロトコルを通じて、AIアシスタントなどのアプリケーションからAivisSpeechの音声合成機能を簡単に利用できるようになります。
概要
AivisSpeech MCP サーバーは以下の機能を提供します:
MCPプロトコルに準拠したAPIエンドポイント
AivisSpeech Engineとの連携による高品質な音声合成
TypeScriptによる型安全な設計
簡単な設定と拡張性の高いアーキテクチャ
必要条件
Node.js 18.x以上
npm 9.x以上
AivisSpeech Engine(別途インストールが必要)
インストール
環境設定
.envファイルで以下の設定を行います:
Cursor MCP設定
.cursor/mcp.jsonファイルで以下の設定を行います:
/path/to/aivis-speech-mcp/dist/index.jsを、実際のプロジェクトのパスに書き換えてください。
Windowsの場合は、バックスラッシュをエスケープするか、フォワードスラッシュを使用してください。
例: "C:/Users/username/path/to/aivis-speech-mcp/dist/index.js"
使い方
開発モード
開発中は以下のコマンドでホットリロード機能付きでサーバーを起動できます:
ビルド
本番環境用にビルドする場合は以下のコマンドを実行します:
本番モード
ビルド後、以下のコマンドで本番モードでサーバーを起動します:
テスト
テストを実行するには以下のコマンドを使用します:
アーキテクチャ
AivisSpeech MCP サーバーは以下のコンポーネントで構成されています:
MCPサービス: Model Context Protocolに準拠したサーバーを提供し、クライアントからのリクエストを処理します
AivisSpeech サービス: AivisSpeech EngineのAPIと通信し、音声合成を実行します
API仕様
MCPプロトコルに準拠したAPIエンドポイントを提供します。主な機能は以下の通りです:
音声合成(テキストから音声を生成)
スピーカー情報の取得
音声スタイルの設定
詳細なAPI仕様についてはAivisSpeech Engine API仕様を参照してください。
MCPプロトコルとの連携
このサーバーは、Model Context Protocol(MCP)を実装しており、AIアシスタントなどのアプリケーションからシームレスに利用できます。MCPプロトコルについての詳細はMCP公式ドキュメントを参照してください。
トラブルシューティング
よくある問題と解決策:
AivisSpeech Engineに接続できない:
.envファイルのAIVIS_SPEECH_API_URLが正しく設定されているか確認してください音声が再生されない: システムの音声設定を確認し、適切なオーディオデバイスが選択されているか確認してください
スピーカーIDが見つからない: AivisSpeech Engineが正しく起動しているか確認し、利用可能なスピーカーIDを確認してください
貢献
バグ報告や機能リクエストは、GitHubのIssueトラッカーを通じてお願いします。プルリクエストも歓迎します。
ライセンス
謝辞
Related MCP Servers
- Asecurity-licenseAqualityA Model Context Protocol server that allows AI assistants to interact with the VRChat API, enabling retrieval of user information, friends lists, and other VRChat data through a standardized interface.Last updated -1810543MIT License
- -securityFlicense-qualityA comprehensive Model Context Protocol server implementation that enables AI assistants to interact with file systems, databases, GitHub repositories, web resources, and system tools while maintaining security and control.Last updated -52
- AsecurityFlicenseAqualityA Model Context Protocol server that enables AI assistants to interact with the Omi API for retrieving and creating conversations and memories for users.Last updated -43
- AsecurityAlicenseAqualityA Model Context Protocol server that integrates with AivisSpeech to enable AI assistants to convert text to natural-sounding Japanese speech with customizable voice parameters.Last updated -1238Apache 2.0