Integrations
Enables containerized deployment of the transcription service, making it portable and providing a consistent runtime environment.
Provides audio file processing capabilities, allowing the transcription service to handle various audio formats like .wav, .mp3, .ogg, and .m4a.
Integrates with OpenAI's Whisper models to provide high-quality, multi-language audio transcription with options for different model sizes.
MCP Audio Transcriber
Ein portables, Dockerized-Python-Tool, das ein Model Context Protocol (MCP) für die Audiotranskription mithilfe der Whisper-Modelle von OpenAI implementiert – und sogar mit einer Streamlit-basierten Web-Benutzeroberfläche geliefert wird, sodass Sie eine Audiodatei hochladen und die Transkription als JSON herunterladen können.
🚀 Funktionen
- Modulare MCP-Schnittstelle (
mcp.py
), die ein standardmäßigesModelContextProtocol
definiert. - Whisper-basierte Implementierung (
WhisperMCP
) für hochwertige, mehrsprachige Transkription. - Befehlszeilenschnittstelle (
app.py
) für Batch- oder Ad-hoc-Transkription:Copy - Docker-Unterstützung für eine konsistente Laufzeit:Copy
- Die Streamlit-Web-App (
streamlit_app.py
) ermöglicht Endbenutzern:- Laden Sie eine beliebige gängige Audiodatei hoch (.wav, .mp3, .ogg, .m4a).
- Wählen Sie eine Whisper-Modellgröße
- Live-Vorschau der Transkription
- Laden Sie das JSON-Ergebnis mit einem Klick herunter
📦 Voraussetzungen
- Python 3.10+
- ffmpeg installiert und auf Ihrem PATH
- (Optional) Docker Engine / Docker Desktop
- (Optional) Streamlit
🔧 Installation
- Klonen Sie das RepoCopy
- Python-Abhängigkeiten und FFmpegCopy
- (Optional) Docker
- Installieren Sie Docker Desktop
- Aktivieren Sie die WSL-Integration, wenn Sie WSL2 verwenden.
- (Optional) StreamlitCopy
🎯 Verwendung
1. CLI-Transkription
<input_audio>
: Pfad zu Ihrer Audiodatei<output_json>
: Pfad, in dem das JSON-Ergebnis gespeichert wird--model
: Wählen Sie die Größe des Whisper-Modells (Standard: Basis)
Beispiel:
2. Docker
Erstellen Sie das Image:
Führen Sie es aus (mounten Sie Ihre Daten/Ordner):
Dann prüfen Sie:
3. Streamlit-Web-Benutzeroberfläche
Starten Sie die App:
- Öffnen Sie http://localhost:8501 in Ihrem Browser
- Hochladen einer Audiodatei
- Wählen Sie die Größe des Whisper-Modells
- Klicken Sie auf Transkribieren
- Vorschau und Download des resultierenden JSON
📁 Projektstruktur
This server cannot be installed
Ein portables, Dockerized-Python-Tool, das das Model Context Protocol für die Audiotranskription mithilfe von Whisper-Modellen implementiert und sowohl CLI- als auch Web-UI-Schnittstellen zum Konvertieren von Audiodateien in JSON-Transkriptionen bietet.
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityAlicense-qualityA Model Context Protocol server that allows AI assistants like Claude and Cursor to create music and control Sonic Pi programmatically through OSC messages.Last updated -JavaScriptMIT License
- AsecurityAlicenseAqualityA MCP server that enables transcription of audio files using OpenAI's Speech-to-Text API, with support for multiple languages and file saving options.Last updated -12JavaScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -11764JavaScriptThe Unlicense