Skip to main content
Glama

Audio MCP Server

オーディオMCPサーバー

ClaudeのようなAIアシスタントにオーディオ入出力機能を提供するMCP(Model Context Protocol)サーバー。このサーバーにより、Claudeはコンピューターのオーディオシステムと連携し、マイクからの録音やスピーカーからの再生などが可能になります。

特徴

  • オーディオデバイスの一覧: システムで利用可能なすべてのマイクとスピーカーを表示します
  • オーディオ録音: カスタマイズ可能な長さと品質で、あらゆるマイクからオーディオをキャプチャします
  • 録音の再生: 最新の録音を再生します
  • オーディオファイルの再生: スピーカーからオーディオファイルを再生します
  • テキスト読み上げ: (将来の実装のためのプレースホルダ)

要件

  • Python 3.8以上
  • システム上のオーディオ入力/出力デバイス

インストール

  1. このリポジトリをクローンするか、ファイルをコンピューターにダウンロードします。
git clone https://github.com/GongRzhe/Audio-MCP-Server.git cd Audio-MCP-Server
  1. 仮想環境を作成し、依存関係をインストールします。
# Windows python -m venv .venv .venv\Scripts\activate pip install -r requirements.txt # macOS/Linux python -m venv .venv source .venv/bin/activate pip install -r requirements.txt
  1. または、付属のセットアップ スクリプトを使用してインストールを自動化します。
python setup_mcp.py

構成

クロードデスクトップ構成

このサーバーを Claude Desktop で使用するには、Claude Desktop 構成ファイルに次の行を追加します。

  • macOS : ~/Library/Application Support/Claude/claude_desktop_config.json
  • Windows : %APPDATA%\Claude\claude_desktop_config.json
{ "mcpServers": { "audio-interface": { "command": "/path/to/your/.venv/bin/python", "args": [ "/path/to/your/audio_server.py" ], "env": { "PYTHONPATH": "/path/to/your/audio-mcp-server" } } } }

パスをシステム上の実際のパスに置き換えてください。セットアップスクリプトがこの設定を自動的に生成します。

使用法

サーバーをセットアップしたら、Claude Desktopを再起動してください。入力ボックスにハンマーアイコンが表示され、ツールが利用可能になっていることがわかります。

クロードに聞いてみてください:

  • 「私のシステムではどのようなマイクとスピーカーが利用できますか?」
  • 「マイクから5秒間の音声を録音してください。」
  • 「音声録音を再生します。」
  • 「コンピューターからオーディオファイルを再生します。」

利用可能なツール

オーディオデバイスのリスト

システムで使用可能なすべてのオーディオ入力および出力デバイスを一覧表示します。

録音オーディオ

マイクからの音声を録音します。

パラメータ:

  • duration : 録画時間(秒)(デフォルト: 5)
  • sample_rate : サンプルレート(Hz)(デフォルト: 44100)
  • channels : オーディオチャンネル数(デフォルト: 1)
  • device_index : 使用する特定の入力デバイスインデックス(デフォルト: システムのデフォルト)

最新の録音を再生する

最後に録音したオーディオを再生します。

再生オーディオ

テキスト読み上げ機能のプレースホルダー。

パラメータ:

  • text : 音声に変換するテキスト
  • voice : 使用する音声(デフォルト: "default")

オーディオファイルを再生する

スピーカーからオーディオ ファイルを再生します。

パラメータ:

  • file_path : オーディオファイルへのパス
  • device_index : 使用する特定の出力デバイスインデックス(デフォルト: システムのデフォルト)

トラブルシューティング

デバイスが見つかりません

オーディオ デバイスが見つからない場合は、以下を確認してください。

  • マイクとスピーカーが正しく接続されています
  • オペレーティングシステムがデバイスを認識します
  • オーディオデバイスにアクセスするために必要な権限があります

再生の問題

オーディオの再生が機能しない場合は:

  • 音量設定を確認してください
  • 正しい出力デバイスが選択されていることを確認してください
  • Claudeデスクトップアプリケーションを再起動してみてください

サーバー接続

クロードがサーバーに接続できない場合:

  • 設定パスが正しいことを確認してください
  • Pythonとすべての依存関係がインストールされていることを確認する
  • クロードのログでエラーメッセージを確認する

ライセンス

マサチューセッツ工科大学

謝辞


注: このサーバーは、マイクとスピーカーにアクセスできるツールを提供しています。ツールのアクションを実行する前に、必ず確認と承認を行ってください。

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Claude やその他の AI アシスタントがコンピューターのオーディオ システムと対話できるようになり、マイクからの録音やスピーカーからのオーディオの再生が可能になります。

  1. 特徴
    1. 要件
      1. インストール
        1. 構成
          1. クロードデスクトップ構成
        2. 使用法
          1. 利用可能なツール
            1. オーディオデバイスのリスト
            2. 録音オーディオ
            3. 最新の録音を再生する
            4. 再生オーディオ
            5. オーディオファイルを再生する
          2. トラブルシューティング
            1. デバイスが見つかりません
            2. 再生の問題
            3. サーバー接続
          3. ライセンス
            1. 謝辞

              Related MCP Servers

              • -
                security
                A
                license
                -
                quality
                A modular server implementation for Claude AI assistants with integrated tools, enabling Claude to perform actions and access external resources like file systems, web searches, browser automation, financial data, and document generation.
                Last updated -
                90
                Python
                MIT License
                • Linux
                • Apple
              • -
                security
                A
                license
                -
                quality
                A server that allows Claude to control audio playback on your computer, supporting MP3, WAV, and OGG files with features like play, list, and stop commands.
                Last updated -
                3
                Python
                MIT License
                • Apple
                • Linux
              • A
                security
                A
                license
                A
                quality
                A server that enables Claude 3.7 and other AI agents to access VOICEVOX-compatible speech synthesis engines (AivisSpeech, VOICEVOX, COEIROINK) through the Model Context Protocol.
                Last updated -
                1
                10
                TypeScript
                MIT License
                • Linux
              • -
                security
                F
                license
                -
                quality
                Enables voice-based interactions with Claude by converting text to speech using Kokoro TTS and transcribing user responses using NVIDIA NeMo ASR, creating interactive voice dialogues.
                Last updated -
                Python

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/GongRzhe/Audio-MCP-Server'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server