Whissle MCP サーバー
音声テキスト変換、ダイアライゼーション、翻訳、テキスト要約のための Whissle API エンドポイントへのアクセスを提供する Python ベースのサーバー。
⚠️ 重要事項
- このサーバーはWhissle APIエンドポイントへのアクセスを提供しますが、これには費用がかかる場合があります。
- API呼び出しを行う各ツールにはコスト警告が表示されます
- 以下のガイドラインに従ってください:
- ユーザーが明示的に要求した場合にのみツールを使用する
- 音声を処理するツールでは、音声の長さがコストに影響するので考慮する
- 翻訳や要約などの一部の操作ではコストが高くなる場合があります
- 説明にコストに関する警告がないツールは、既存のデータを読み取るだけなので無料で使用できます。
前提条件
- Python 3.8以上
- pip (Python パッケージインストーラー)
- Whissle API認証トークン
インストール
- リポジトリをクローンします。
- 仮想環境を作成してアクティブ化します。
- 必要なパッケージをインストールします。
- 環境変数を設定します。プロジェクト ルートに次の内容の
.env
ファイルを作成します。⚠️重要:実際のトークンをリポジトリにコミットしないでください。.env ファイル.env
、誤ってコミットされないように.gitignore
に含まれています。 - Claude 統合を構成する:
claude_config.example.json
をclaude_config.json
にコピーし、パスを更新します。/path/to/your/venv/bin/python
仮想環境内の Python インタープリターの実際のパスに置き換えます。/path/to/whissle_mcp/server.py
を server.py ファイルへの実際のパスに置き換えます。
構成
環境変数
WHISSLE_AUTH_TOKEN
: Whissle API 認証トークン(必須)- これは機密性の高い認証情報であり、決して共有したりバージョン管理にコミットしたりしてはいけません。
- 有効なトークンを取得するには、管理者に問い合わせてください
- ローカルの
.env
ファイルに安全に保存します
WHISSLE_MCP_BASE_PATH
: ファイル操作のベースディレクトリ(オプション、デフォルトはユーザーのデスクトップ)
サポートされているオーディオ形式
サーバーは次のオーディオ形式をサポートしています。
- WAV (.wav)
- MP3 (.mp3)
- OGG (.ogg)
- FLAC (.flac)
- M4A (.m4a)
ファイルサイズの制限
- 最大ファイルサイズ: 25 MB
- この制限を超えるファイルは拒否されます
利用可能なツール
1. 音声テキスト変換
Whissle API を使用して音声をテキストに変換します。
2. 音声ダイアライゼーション
話者識別機能を使用して音声をテキストに変換します。
3. テキスト翻訳
テキストをある言語から別の言語に翻訳します。
4. テキスト要約
LLM モデルを使用してテキストを要約します。
5. ASRモデルの一覧
利用可能なすべての ASR モデルとその機能を一覧表示します。
応答フォーマット
音声テキスト化とダイアライゼーション
翻訳
要約
エラー応答
エラー処理
サーバーには、次のような堅牢なエラー処理機能が含まれています。
- HTTP 500 エラーの自動再試行
- さまざまな障害シナリオの詳細なエラーメッセージ
- ファイルの検証(存在、サイズ、形式)
- 認証チェック
一般的なエラーの種類:
- HTTP 500: サーバー エラー (再試行メカニズムあり)
- HTTP 413: ファイルが大きすぎます
- HTTP 415: サポートされていないファイル形式
- HTTP 401/403: 認証エラー
サーバーの実行
- サーバーを起動します。
- サーバーはデフォルトのMCPポート(通常は8000)で利用可能になります。
テスト
すべてのツールの機能を検証するためのテスト スクリプトが提供されています。
テスト スクリプトは次の処理を実行します。
- 認証トークンを確認する
- 利用可能なすべてのツールをテストする
- 各操作の詳細な出力を提供する
- エラーを適切に処理する
サポート
問題や質問がある場合は、以下までお問い合わせください。
- 詳細についてはエラーメッセージを確認してください
- 認証トークンを確認する
- オーディオファイルが要件を満たしていることを確認する
- API関連の問題についてはWhissleサポートにお問い合わせください
ライセンス
[ここにライセンス情報を追加してください]
You must be authenticated.
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
音声テキスト変換、ダイアライゼーション、翻訳、テキスト要約のための Whissle API エンドポイントへのアクセスを提供する Python ベースのサーバー。
Related MCP Servers
- AsecurityAlicenseAqualityIntegrates with ElevenLabs text-to-speech API.Last updated -636PythonMIT License
- -securityFlicense-qualityA server providing text-to-speech and speech-to-text functionalities using Windows' native speech services without external dependencies.Last updated -4JavaScript
- AsecurityAlicenseAqualityA Python server that enables language models like Claude to interact with WhatsApp Business API through GreenAPI, supporting features like sending messages and managing groups.Last updated -54PythonMIT License
- -securityAlicense-qualityA Python package that implements a Model Context Protocol server for integrating with Flowise API, allowing users to list chatflows, create predictions, and dynamically register tools for Flowise chatflows or assistants.Last updated -PythonMIT License