MCP Audio Transcriber
Ein Docker-Python-Tool, das das Model Context Protocol (MCP) über die API von AssemblyAI implementiert. Laden Sie eine Audiodatei hoch oder verweisen Sie darauf, und erhalten Sie eine strukturierte JSON-Transkription.
Merkmale
AssemblyMCP : eine konkrete MCP-Implementierung, die die REST-API von AssemblyAI verwendet
Befehlszeilenschnittstelle (
app.py):python app.py <input_audio> <output_json>Streamlit-Web-Benutzeroberfläche (
streamlit_app.py):Laden Sie lokale Dateien hoch oder fügen Sie URLs ein
Klicken Sie auf Transkribieren
Transkriptvorschau und JSON herunterladen
Docker-Unterstützung für Umgebungskonsistenz und Portabilität
Voraussetzungen
Python 3.10+
Ein AssemblyAI-API-Schlüssel
ffmpeg (für lokale Dekodierung, wenn lokale Dateien verwendet werden)
(Optional) Docker Desktop / Engine
(Optional) Streamlit (
pip install streamlit)
🔧 Installation
Klonen Sie das Repo
git clone https://github.com/ShreyasTembhare/MCP---Audio-Transcriber.git cd MCP---Audio-TranscriberErstellen Sie eine
.envASSEMBLYAI_API_KEY=your_assemblyai_api_key_hereStellen Sie sicher, dass
.gitignoreFolgendes enthält:.envInstallieren Sie Python-Abhängigkeiten
pip install --upgrade pip pip install -r requirements.txtInstallieren Sie ffmpeg
Ubuntu/Debian:
sudo apt update && sudo apt install ffmpeg -yWindows: Laden Sie es von https://ffmpeg.org herunter und fügen Sie
bin/zu Ihrem PATH hinzu
Verwendung
1. CLI-Transkription
<input_audio>: jede von AssemblyAI unterstützte Datei oder URL<output_json>: Pfad für das generierte JSON
Beispiel:
2. Streamlit-Web-Benutzeroberfläche
Öffnen Sie http://localhost:8501
Audio-URL hochladen oder eingeben
Klicken Sie auf Transkribieren
Laden Sie das JSON-Ergebnis herunter
3. Docker
Erstellen Sie das Image:
Führen Sie es aus (mounten Sie Ihre Daten/Ordner):
Dann prüfen Sie:
Windows PowerShell:
Projektstruktur
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Ein portables, Dockerized-Python-Tool, das das Model Context Protocol für die Audiotranskription mithilfe von Whisper-Modellen implementiert und sowohl CLI- als auch Web-UI-Schnittstellen zum Konvertieren von Audiodateien in JSON-Transkriptionen bietet.
Related MCP Servers
- -security-license-qualityEnables recording audio from a microphone and transcribing it using OpenAI's Whisper model. Works as both a standalone MCP server and a Goose AI agent extension.Last updated -6MIT License
 - -security-license-qualityA Model Context Protocol server that provides AI-powered features for the Transcripter project, including tools for searching and summarizing transcriptions and resources for accessing transcription and analysis data.
 - -security-license-qualityEnables seamless integration with Typecast API through the Model Context Protocol, allowing clients to manage voices, convert text to speech, and play audio in a standardized way.Last updated -2
 Gladia MCPofficial
-security-license-qualityOfficial Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.