ボイスレコーダーMCPサーバー
OpenAIのWhisperモデルを用いて音声を録音し、文字起こしするためのMCPサーバー。Gooseカスタム拡張機能またはスタンドアロンMCPサーバーとして機能するように設計されています。
特徴
デフォルトのマイクから音声を録音する
Whisperを使用して録音を書き起こす
Goose AIエージェントとカスタム拡張機能として統合
一般的な録音シナリオのプロンプトが含まれています
Related MCP server: Audio Transcriber MCP Server
インストール
使用法
スタンドアロンMCPサーバーとして
MCP Inspectorによるテスト
MCP Inspector は、サーバーをテストするためのインタラクティブなインターフェースを提供します。
Goose AIエージェント
Gooseを開き、「設定」>「拡張機能」>「追加」>「コマンドライン拡張機能」に進みます。
名前を
voice-recorderに設定するコマンド フィールドに、voice-recorder-mcp 実行可能ファイルへのフル パスを入力します。
/full/path/to/voice-recorder-mcpまたは特定のモデルの場合:
/full/path/to/voice-recorder-mcp --model medium.enパスを見つけるには、次を実行します。
which voice-recorder-mcp基本的な機能には環境変数は必要ありません
Goose との会話を開始し、次のようにレコーダーを紹介します。「ボイスレコーダーから返された文字起こしに基づいてアクションを実行してほしいです。たとえば、1+1 のような計算を音声で指示した場合、結果を返してください。」
利用可能なツール
start_recording: デフォルトのマイクから音声の録音を開始しますstop_and_transcribe: 録音を停止し、音声をテキストに書き起こすrecord_and_transcribe: 指定した時間だけ音声を録音し、書き起こす
ウィスパーモデル
この拡張機能は、さまざまな Whisper モデル サイズをサポートしています。
モデル | スピード | 正確さ | メモリ使用量 | 使用事例 |
| 最速 | 最低 | 最小限 | テスト、クイックトランスクリプション |
| 速い | 良い | 低い | 日常使用(デフォルト) |
| 中くらい | より良い | 適度 | バランスが良い |
| 遅い | 高い | 高い | 重要な録音 |
| 最も遅い | 最高 | 非常に高い | 重要な転写 |
.enサフィックスは、英語に特化したモデルを示し、英語コンテンツに対してより高速かつ正確です。
要件
Python 3.12以上
オーディオ入力デバイス(マイク)
構成
環境変数を使用してサーバーを構成できます。
トラブルシューティング
よくある問題
音声が録音されません: マイクの権限と設定を確認してください
モデルのダウンロードエラー: 最初のモデルのダウンロード時に安定したインターネット接続があることを確認してください
Gooseとの統合: コマンドパスが正しいことを確認してください
オーディオ品質の問題: サンプルレートを調整してみてください (デフォルト: 16000)
貢献
貢献を歓迎します!お気軽にプルリクエストを送信してください。
リポジトリをフォークする
機能ブランチを作成します(
git checkout -b feature/amazing-feature)変更をコミットします (
git commit -m 'Add some amazing feature')ブランチにプッシュする (
git push origin feature/amazing-feature)プルリクエストを開く
ライセンス
このプロジェクトは MIT ライセンスに基づいてライセンスされています - 詳細については LICENSE ファイルを参照してください。