Transcriptor de audio MCP
Una herramienta de Python Dockerizada que implementa el Protocolo de Contexto de Modelo (MCP) mediante la API de AssemblyAI. Sube o apunta a un archivo de audio y recibe una transcripción JSON estructurada.
Características
AssemblyMCP : una implementación concreta de MCP que utiliza la API REST de AssemblyAI
Interfaz de línea de comandos (
app.py
):python app.py <input_audio> <output_json>Interfaz web de Streamlit (
streamlit_app.py
):Subir archivos locales o pegar URL
Haga clic en Transcribir
Vista previa de la transcripción y descarga JSON
Compatibilidad de Docker con la coherencia y portabilidad del entorno
Prerrequisitos
Python 3.10+
Una clave API de AssemblyAI
ffmpeg (para decodificación local, si se utilizan archivos locales)
(Opcional) Docker Desktop/Motor
(Opcional) Streamlit (
pip install streamlit
)
🔧 Instalación
Clonar el repositorio
git clone https://github.com/ShreyasTembhare/MCP---Audio-Transcriber.git cd MCP---Audio-TranscriberCrear un
.env
ASSEMBLYAI_API_KEY=your_assemblyai_api_key_hereAsegúrese de que
.gitignore
contenga:.envInstalar dependencias de Python
pip install --upgrade pip pip install -r requirements.txtInstalar ffmpeg
Ubuntu/Debian:
sudo apt update && sudo apt install ffmpeg -y
Windows: descargue desde https://ffmpeg.org y agregue su
bin/
a su RUTA
Uso
1. Transcripción CLI
<input_audio>
: cualquier archivo o URL compatible con AssemblyAI<output_json>
: ruta para el JSON generado
Ejemplo:
2. Interfaz web optimizada
Subir o ingresar una URL de audio
Haga clic en Transcribir
Descargar el resultado JSON
3. Docker
Construye la imagen:
Ejecútalo (montando tus datos/carpeta):
Luego inspeccionar:
Windows PowerShell:
Estructura del proyecto
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Una herramienta Python portátil y Dockerizada que implementa el Protocolo de Contexto de Modelo para la transcripción de audio utilizando modelos Whisper, con interfaces CLI y UI web para convertir archivos de audio en transcripciones JSON.
Related MCP Servers
- -securityAlicense-qualityEnables recording audio from a microphone and transcribing it using OpenAI's Whisper model. Works as both a standalone MCP server and a Goose AI agent extension.Last updated -6MIT License
- -securityFlicense-qualityA Model Context Protocol server that provides AI-powered features for the Transcripter project, including tools for searching and summarizing transcriptions and resources for accessing transcription and analysis data.
- -securityFlicense-qualityEnables seamless integration with Typecast API through the Model Context Protocol, allowing clients to manage voices, convert text to speech, and play audio in a standardized way.Last updated -2
Gladia MCPofficial
-securityAlicense-qualityOfficial Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.