Skip to main content
Glama

MCP Audio Transcriber

MCP Audio Transcriber

Ein Docker-Python-Tool, das das Model Context Protocol (MCP) über die API von AssemblyAI implementiert. Laden Sie eine Audiodatei hoch oder verweisen Sie darauf, und erhalten Sie eine strukturierte JSON-Transkription.

Merkmale

  • AssemblyMCP : eine konkrete MCP-Implementierung, die die REST-API von AssemblyAI verwendet

  • Befehlszeilenschnittstelle ( app.py ):

    python app.py <input_audio> <output_json>
  • Streamlit-Web-Benutzeroberfläche ( streamlit_app.py ):

    • Laden Sie lokale Dateien hoch oder fügen Sie URLs ein

    • Klicken Sie auf Transkribieren

    • Transkriptvorschau und JSON herunterladen

  • Docker-Unterstützung für Umgebungskonsistenz und Portabilität

Voraussetzungen

  • Python 3.10+

  • Ein AssemblyAI-API-Schlüssel

  • ffmpeg (für lokale Dekodierung, wenn lokale Dateien verwendet werden)

  • (Optional) Docker Desktop / Engine

  • (Optional) Streamlit ( pip install streamlit )

🔧 Installation

  1. Klonen Sie das Repo

    git clone https://github.com/ShreyasTembhare/MCP---Audio-Transcriber.git cd MCP---Audio-Transcriber
  2. Erstellen Sie eine .env

    ASSEMBLYAI_API_KEY=your_assemblyai_api_key_here
  3. Stellen Sie sicher, dass .gitignore Folgendes enthält:

    .env
  4. Installieren Sie Python-Abhängigkeiten

    pip install --upgrade pip pip install -r requirements.txt
  5. Installieren Sie ffmpeg

    • Ubuntu/Debian: sudo apt update && sudo apt install ffmpeg -y

    • Windows: Laden Sie es von https://ffmpeg.org herunter und fügen Sie bin/ zu Ihrem PATH hinzu

Verwendung

1. CLI-Transkription

python app.py <input_audio> <output_json>
  • <input_audio> : jede von AssemblyAI unterstützte Datei oder URL

  • <output_json> : Pfad für das generierte JSON

Beispiel:

python app.py data/input.ogg data/output.json cat data/output.json

2. Streamlit-Web-Benutzeroberfläche

streamlit run streamlit_app.py
  • Öffnen Sie http://localhost:8501

  • Audio-URL hochladen oder eingeben

  • Klicken Sie auf Transkribieren

  • Laden Sie das JSON-Ergebnis herunter

3. Docker

Erstellen Sie das Image:

docker build -t mcp-transcriber .

Führen Sie es aus (mounten Sie Ihre Daten/Ordner):

docker run --rm \ -e ASSEMBLYAI_API_KEY="$ASSEMBLYAI_API_KEY" \ -v "$(pwd)/data:/data" \ mcp-transcriber:latest \ /data/input.ogg /data/output.json

Dann prüfen Sie:

ls data/output.json cat data/output.json

Windows PowerShell:

docker run --rm ` -e ASSEMBLYAI_API_KEY=$env:ASSEMBLYAI_API_KEY ` -v "${PWD}\data:/data" ` mcp-transcriber:latest ` /data/input.ogg /data/output.json

Projektstruktur

MCP-Audio-Transcriber/ ├── app.py # CLI entrypoint (AssemblyMCP only) ├── mcp.py # ModelContextProtocol + AssemblyMCP ├── streamlit_app.py # Streamlit interface ├── requirements.txt # assemblyai, python-dotenv, streamlit, etc. ├── Dockerfile # builds the container ├── .gitignore # ignores .env, __pycache__, etc. ├── LICENSE # MIT license └── data/ # sample input and output ├── input.ogg └── output.json
-
security - not tested
-
license - not tested
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Ein portables, Dockerized-Python-Tool, das das Model Context Protocol für die Audiotranskription mithilfe von Whisper-Modellen implementiert und sowohl CLI- als auch Web-UI-Schnittstellen zum Konvertieren von Audiodateien in JSON-Transkriptionen bietet.

  1. Merkmale
    1. Voraussetzungen
      1. 🔧 Installation
        1. Verwendung
          1. 1. CLI-Transkription
          2. 2. Streamlit-Web-Benutzeroberfläche
          3. 3. Docker
        2. Projektstruktur

          Related MCP Servers

          • -
            security
            -
            license
            -
            quality
            Enables recording audio from a microphone and transcribing it using OpenAI's Whisper model. Works as both a standalone MCP server and a Goose AI agent extension.
            Last updated -
            6
            MIT License
          • -
            security
            -
            license
            -
            quality
            A Model Context Protocol server that provides AI-powered features for the Transcripter project, including tools for searching and summarizing transcriptions and resources for accessing transcription and analysis data.
          • -
            security
            -
            license
            -
            quality
            Enables seamless integration with Typecast API through the Model Context Protocol, allowing clients to manage voices, convert text to speech, and play audio in a standardized way.
            Last updated -
            2
          • Gladia MCPofficial

            -
            security
            -
            license
            -
            quality
            Official Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.

          View all related MCP servers

          MCP directory API

          We provide all the information about MCP servers via our MCP API.

          curl -X GET 'https://glama.ai/api/mcp/v1/servers/ShreyasTembhare/MCP---Audio-Transcriber'

          If you have feedback or need assistance with the MCP directory API, please join our Discord server