オーディオMCPサーバー

ClaudeのようなAIアシスタントにオーディオ入出力機能を提供するMCP（Model Context Protocol）サーバー。このサーバーにより、Claudeはコンピューターのオーディオシステムと連携し、マイクからの録音やスピーカーからの再生などが可能になります。

特徴

オーディオデバイスの一覧: システムで利用可能なすべてのマイクとスピーカーを表示します
オーディオ録音: カスタマイズ可能な長さと品質で、あらゆるマイクからオーディオをキャプチャします
録音の再生: 最新の録音を再生します
オーディオファイルの再生: スピーカーからオーディオファイルを再生します
テキスト読み上げ: (将来の実装のためのプレースホルダ)

要件

Python 3.8以上
システム上のオーディオ入力/出力デバイス

インストール

このリポジトリをクローンするか、ファイルをコンピューターにダウンロードします。

git clone https://github.com/GongRzhe/Audio-MCP-Server.git
cd Audio-MCP-Server

仮想環境を作成し、依存関係をインストールします。

# Windows
python -m venv .venv
.venv\Scripts\activate
pip install -r requirements.txt

# macOS/Linux
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

または、付属のセットアップスクリプトを使用してインストールを自動化します。

python setup_mcp.py

構成

クロードデスクトップ構成

このサーバーを Claude Desktop で使用するには、Claude Desktop 構成ファイルに次の行を追加します。

macOS : ~/Library/Application Support/Claude/claude_desktop_config.json
Windows : %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "audio-interface": {
      "command": "/path/to/your/.venv/bin/python",
      "args": [
        "/path/to/your/audio_server.py"
      ],
      "env": {
        "PYTHONPATH": "/path/to/your/audio-mcp-server"
      }
    }
  }
}

パスをシステム上の実際のパスに置き換えてください。セットアップスクリプトがこの設定を自動的に生成します。

使用法

サーバーをセットアップしたら、Claude Desktopを再起動してください。入力ボックスにハンマーアイコンが表示され、ツールが利用可能になっていることがわかります。

クロードに聞いてみてください:

「私のシステムではどのようなマイクとスピーカーが利用できますか？」
「マイクから5秒間の音声を録音してください。」
「音声録音を再生します。」
「コンピューターからオーディオファイルを再生します。」

利用可能なツール

オーディオデバイスのリスト

システムで使用可能なすべてのオーディオ入力および出力デバイスを一覧表示します。

録音オーディオ

マイクからの音声を録音します。

パラメータ:

duration : 録画時間（秒）（デフォルト: 5）
sample_rate : サンプルレート（Hz）（デフォルト: 44100）
channels : オーディオチャンネル数（デフォルト: 1）
device_index : 使用する特定の入力デバイスインデックス（デフォルト: システムのデフォルト）

再生オーディオ

テキスト読み上げ機能のプレースホルダー。

パラメータ:

text : 音声に変換するテキスト
voice : 使用する音声（デフォルト: "default")

オーディオファイルを再生する

スピーカーからオーディオファイルを再生します。

パラメータ:

file_path : オーディオファイルへのパス
device_index : 使用する特定の出力デバイスインデックス（デフォルト: システムのデフォルト）

トラブルシューティング

デバイスが見つかりません

オーディオデバイスが見つからない場合は、以下を確認してください。

マイクとスピーカーが正しく接続されています
オペレーティングシステムがデバイスを認識します
オーディオデバイスにアクセスするために必要な権限があります

再生の問題

オーディオの再生が機能しない場合は:

音量設定を確認してください
正しい出力デバイスが選択されていることを確認してください
Claudeデスクトップアプリケーションを再起動してみてください

サーバー接続

クロードがサーバーに接続できない場合:

設定パスが正しいことを確認してください
Pythonとすべての依存関係がインストールされていることを確認する
クロードのログでエラーメッセージを確認する

ライセンス

マサチューセッツ工科大学

謝辞

モデルコンテキストプロトコルを使用して構築
オーディオ処理にはサウンドデバイスとサウンドファイルを使用します

注: このサーバーは、マイクとスピーカーにアクセスできるツールを提供しています。ツールのアクションを実行する前に、必ず確認と承認を行ってください。

This server cannot be installed

security - not tested

license - permissive license

quality - not tested

How are these scores calculated?

local-only server

The server can only run on the client's local machine because it depends on local resources.

Claude やその他の AI アシスタントがコンピューターのオーディオシステムと対話できるようになり、マイクからの録音やスピーカーからのオーディオの再生が可能になります。

Related MCP Servers

MCP Unified Server
getfounded
-
security
A
license
-
quality
A modular server implementation for Claude AI assistants with integrated tools, enabling Claude to perform actions and access external resources like file systems, web searches, browser automation, financial data, and document generation.
Last updated -
90
Python
MIT License
Audio Player MCP Server
Here-and-Tomorrow-LLC
-
security
A
license
-
quality
A server that allows Claude to control audio playback on your computer, supporting MP3, WAV, and OGG files with features like play, list, and stop commands.
Last updated -
3
Python
MIT License
Voicevox MCP Server
Dosugamea
A
security
A
license
A
quality
A server that enables Claude 3.7 and other AI agents to access VOICEVOX-compatible speech synthesis engines (AivisSpeech, VOICEVOX, COEIROINK) through the Model Context Protocol.
Last updated -
1
10
TypeScript
MIT License
Interactive Voice MCP Server
rungee84
-
security
F
license
-
quality
Enables voice-based interactions with Claude by converting text to speech using Kokoro TTS and transcribing user responses using NVIDIA NeMo ASR, creating interactive voice dialogues.
Last updated -
Python

View all related MCP servers

Audio MCP Server