MCP オーディオトランスクリプター
AssemblyAIのAPIを介してモデルコンテキストプロトコル(MCP)を実装する、Docker化されたPythonツールです。音声ファイルをアップロードまたは指定すると、構造化されたJSON形式の文字起こしが提供されます。
特徴
AssemblyMCP : AssemblyAIのREST APIを使用する具体的なMCP実装
コマンドラインインターフェース(
app.py
):python app.py <input_audio> <output_json>Streamlit ウェブ UI (
streamlit_app.py
):ロ���カルファイルをアップロードするか、URLを貼り付けます
「文字起こし」をクリック
トランスクリプトをプレビューし、JSON をダウンロードする
環境の一貫性と移植性のためのDocker サポート
前提条件
Python 3.10以上
AssemblyAI APIキー
ffmpeg (ローカルファイルを使用する場合のローカルデコード用)
(オプション)Dockerデスクトップ/エンジン
(オプション)Streamlit(
pip install streamlit
)
🔧 インストール
リポジトリをクローンする
git clone https://github.com/ShreyasTembhare/MCP---Audio-Transcriber.git cd MCP---Audio-Transcriber.env
を作成するASSEMBLYAI_API_KEY=your_assemblyai_api_key_here.gitignore
に以下が含まれていることを確認します。.envPythonの依存関係をインストールする
pip install --upgrade pip pip install -r requirements.txtffmpegをインストールする
Ubuntu/Debian:
sudo apt update && sudo apt install ffmpeg -y
Windows: https://ffmpeg.orgからダウンロードし、
bin/
PATH に追加します。
使用法
1. CLIトランスクリプション
<input_audio>
: AssemblyAI でサポートされている任意のファイルまたは URL<output_json>
: 生成されたJSONのパス
例:
2. Streamlit Web UI
http://localhost:8501を開きます。
オーディオURLをアップロードまたは入力してください
「文字起こし」をクリック
JSON結果をダウンロードする
3. ドッカー
イメージをビルドします。
実行します(data/ フォルダをマウントします)。
次に検査します:
Windows PowerShell:
プロジェクト構造
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Whisper モデルを使用してオーディオ転写用のモデル コンテキスト プロトコルを実装する、ポータブルな Dockerized Python ツールです。オーディオ ファイルを JSON 転写に変換するための CLI と Web UI の両方のインターフェースを備えています。
Related MCP Servers
- -securityAlicense-qualityEnables recording audio from a microphone and transcribing it using OpenAI's Whisper model. Works as both a standalone MCP server and a Goose AI agent extension.Last updated -6MIT License
- -securityFlicense-qualityA Model Context Protocol server that provides AI-powered features for the Transcripter project, including tools for searching and summarizing transcriptions and resources for accessing transcription and analysis data.
- -securityFlicense-qualityEnables seamless integration with Typecast API through the Model Context Protocol, allowing clients to manage voices, convert text to speech, and play audio in a standardized way.Last updated -2
Gladia MCPofficial
-securityAlicense-qualityOfficial Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.