MCP Audio Transcriber
Ein Docker-Python-Tool, das das Model Context Protocol (MCP) über die API von AssemblyAI implementiert. Laden Sie eine Audiodatei hoch oder verweisen Sie darauf, und erhalten Sie eine strukturierte JSON-Transkription.
Merkmale
- AssemblyMCP : eine konkrete MCP-Implementierung, die die REST-API von AssemblyAI verwendet
- Befehlszeilenschnittstelle (
app.py
): - Streamlit-Web-Benutzeroberfläche (
streamlit_app.py
):- Laden Sie lokale Dateien hoch oder fügen Sie URLs ein
- Klicken Sie auf Transkribieren
- Transkriptvorschau und JSON herunterladen
- Docker-Unterstützung für Umgebungskonsistenz und Portabilität
Voraussetzungen
- Python 3.10+
- Ein AssemblyAI-API-Schlüssel
- ffmpeg (für lokale Dekodierung, wenn lokale Dateien verwendet werden)
- (Optional) Docker Desktop / Engine
- (Optional) Streamlit (
pip install streamlit
)
🔧 Installation
- Klonen Sie das Repo
- Erstellen Sie eine
.env
- Stellen Sie sicher, dass
.gitignore
Folgendes enthält: - Installieren Sie Python-Abhängigkeiten
- Installieren Sie ffmpeg
- Ubuntu/Debian:
sudo apt update && sudo apt install ffmpeg -y
- Windows: Laden Sie es von https://ffmpeg.org herunter und fügen Sie
bin/
zu Ihrem PATH hinzu
- Ubuntu/Debian:
Verwendung
1. CLI-Transkription
<input_audio>
: jede von AssemblyAI unterstützte Datei oder URL<output_json>
: Pfad für das generierte JSON
Beispiel:
2. Streamlit-Web-Benutzeroberfläche
- Öffnen Sie http://localhost:8501
- Audio-URL hochladen oder eingeben
- Klicken Sie auf Transkribieren
- Laden Sie das JSON-Ergebnis herunter
3. Docker
Erstellen Sie das Image:
Führen Sie es aus (mounten Sie Ihre Daten/Ordner):
Dann prüfen Sie:
Windows PowerShell:
Projektstruktur
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Ein portables, Dockerized-Python-Tool, das das Model Context Protocol für die Audiotranskription mithilfe von Whisper-Modellen implementiert und sowohl CLI- als auch Web-UI-Schnittstellen zum Konvertieren von Audiodateien in JSON-Transkriptionen bietet.
Related MCP Servers
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -2Python
- -securityAlicense-qualityA Model Context Protocol server that allows AI assistants like Claude and Cursor to create music and control Sonic Pi programmatically through OSC messages.Last updated -107TypeScriptMIT License
- AsecurityAlicenseAqualityA MCP server that enables transcription of audio files using OpenAI's Speech-to-Text API, with support for multiple languages and file saving options.Last updated -12JavaScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -1154JavaScriptThe Unlicense