MCP Аудио Транскрибатор
Инструмент Python Dockerized, реализующий протокол контекста модели (MCP) через API AssemblyAI. Загрузите или укажите на аудиофайл и получите структурированную транскрипцию JSON.
Функции
AssemblyMCP : конкретная реализация MCP, использующая REST API AssemblyAI
Интерфейс командной строки (
app.py
):python app.py <input_audio> <output_json>Веб-интерфейс Streamlit (
streamlit_app.py
):Загрузите локальные файлы или вставьте URL-адреса
Нажмите «Транскрибировать»
Предварительный просмотр транскрипта и загрузка JSON
Поддержка Docker для обеспечения согласованности и переносимости среды
Предпосылки
Питон 3.10+
API-ключ AssemblyAI
ffmpeg (для локального декодирования, если используются локальные файлы)
(Необязательно) Рабочий стол Docker / Движок
(Необязательно) Streamlit (
pip install streamlit
)
🔧 Установка
Клонировать репозиторий
git clone https://github.com/ShreyasTembhare/MCP---Audio-Transcriber.git cd MCP---Audio-TranscriberСоздать
.env
ASSEMBLYAI_API_KEY=your_assemblyai_api_key_hereУбедитесь, что
.gitignore
содержит:.envУстановить зависимости Python
pip install --upgrade pip pip install -r requirements.txtУстановить ffmpeg
Ubuntu/Debian:
sudo apt update && sudo apt install ffmpeg -y
Windows: скачайте с https://ffmpeg.org и добавьте его
bin/
в ваш PATH
Использование
1. Транскрипция CLI
<input_audio>
: любой файл или URL, поддерживаемый AssemblyAI<output_json>
: путь для сгенерированного JSON
Пример:
2. Streamlit Web UI
Откройте http://localhost:8501
Загрузите или введите URL-адрес аудио
Нажмите «Транскрибировать»
Загрузите результат JSON
3. Докер
Создайте изображение:
Запустите его (смонтировав папку data/):
Затем проверьте:
Windows PowerShell:
Структура проекта
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Портативный, Docker-ориентированный инструмент Python, реализующий протокол контекста модели для аудиотранскрипции с использованием моделей Whisper, включающий интерфейсы CLI и веб-интерфейса для преобразования аудиофайлов в транскрипции JSON.
Related MCP Servers
- -securityAlicense-qualityEnables recording audio from a microphone and transcribing it using OpenAI's Whisper model. Works as both a standalone MCP server and a Goose AI agent extension.Last updated -6MIT License
- -securityFlicense-qualityA Model Context Protocol server that provides AI-powered features for the Transcripter project, including tools for searching and summarizing transcriptions and resources for accessing transcription and analysis data.
- -securityFlicense-qualityEnables seamless integration with Typecast API through the Model Context Protocol, allowing clients to manage voices, convert text to speech, and play audio in a standardized way.Last updated -2
Gladia MCPofficial
-securityAlicense-qualityOfficial Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.