Integrations
Provides installation support via GitHub repository, allowing users to clone and install the voice-recorder-mcp from DefiBax's GitHub account
Uses OpenAI's Whisper model for audio transcription, enabling conversion of recorded voice to text with different model sizes for varying accuracy and performance needs
ボイスレコーダーMCPサーバー
OpenAIのWhisperモデルを用いて音声を録音し、文字起こしするためのMCPサーバー。Gooseカスタム拡張機能またはスタンドアロンMCPサーバーとして機能するように設計されています。
特徴
- デフォルトのマイクから音声を録音する
- Whisperを使用して録音を書き起こす
- Goose AIエージェントとカスタム拡張機能として統合
- 一般的な録音シナリオのプロンプトが含まれています
インストール
使用法
スタンドアロンMCPサーバーとして
MCP Inspectorによるテスト
MCP Inspector は、サーバーをテストするためのインタラクティブなインターフェースを提供します。
Goose AIエージェント
- Gooseを開き、「設定」>「拡張機能」>「追加」>「コマンドライン拡張機能」に進みます。
- 名前を
voice-recorder
に設定する - コマンド フィールドに、voice-recorder-mcp 実行可能ファイルへのフル パスを入力します。または特定のモデルの場合:Copyパスを見つけるには、次を実行します。CopyCopy
- 基本的な機能には環境変数は必要ありません
- Goose との会話を開始し、次のようにレコーダーを紹介します。「ボイスレコーダーから返された文字起こしに基づいてアクションを実行してほしいです。たとえば、1+1 のような計算を音声で指示した場合、結果を返してください。」
利用可能なツール
start_recording
: デフォルトのマイクから音声の録音を開始しますstop_and_transcribe
: 録音を停止し、音声をテキストに書き起こすrecord_and_transcribe
: 指定した時間だけ音声を録音し、書き起こす
ウィスパーモデル
この拡張機能は、さまざまな Whisper モデル サイズをサポートしています。
モデル | スピード | 正確さ | メモリ使用量 | 使用事例 |
---|---|---|---|---|
tiny.en | 最速 | 最低 | 最小限 | テスト、クイックトランスクリプション |
base.en | 速い | 良い | 低い | 日常使用(デフォルト) |
small.en | 中くらい | より良い | 適度 | バランスが良い |
medium.en | 遅い | 高い | 高い | 重要な録音 |
large | 最も遅い | 最高 | 非常に高い | 重要な転写 |
.en
サフィックスは、英語に特化したモデルを示し、英語コンテンツに対してより高速かつ正確です。
要件
- Python 3.12以上
- オーディオ入力デバイス(マイク)
構成
環境変数を使用してサーバーを構成できます。
トラブルシューティング
よくある問題
- 音声が録音されません: マイクの権限と設定を確認してください
- モデルのダウンロードエラー: 最初のモデルのダウンロード時に安定したインターネット接続があることを確認してください
- Gooseとの統合: コマンドパスが正しいことを確認してください
- オーディオ品質の問題: サンプルレートを調整してみてください (デフォルト: 16000)
貢献
貢献を歓迎します!お気軽にプルリクエストを送信してください。
- リポジトリをフォークする
- 機能ブランチを作成します(
git checkout -b feature/amazing-feature
) - 変更をコミットします (
git commit -m 'Add some amazing feature'
) - ブランチにプッシュする (
git push origin feature/amazing-feature
) - プルリクエストを開く
ライセンス
このプロジェクトは MIT ライセンスに基づいてライセンスされています - 詳細については LICENSE ファイルを参照してください。
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
マイクからの音声を録音し、OpenAIのWhisperモデルを使用して文字起こしできます。スタンドアロンのMCPサーバーとしても、Goose AIエージェント拡張機能としても機能します。
- Features
- Installation
- Usage
- Available Tools
- Whisper Models
- Requirements
- Configuration
- Troubleshooting
- Contributing
- License
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityA MCP server that enables transcription of audio files using OpenAI's Speech-to-Text API, with support for multiple languages and file saving options.Last updated -12JavaScriptMIT License
- AsecurityAlicenseAqualityMCP server for Synthesizer V AI Vocal Studio, which allows LLMs to create/edit vocal tracks e.g. adding lyrics to the melody.Last updated -6Apache 2.0
- -security-license-qualityAn MCP server that enables LLMs to generate spoken audio from text using OpenAI's Text-to-Speech API, supporting various voices, models, and audio formats.Last updated -1JavaScriptMIT License
ElevenLabs MCP Serverofficial
AsecurityAlicenseAqualityAn official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.Last updated -19543PythonMIT License