Skip to main content
Glama

Audio Transcriber MCP Server

by Ichigo3766

OpenAI 音声テキスト変換 MCP サーバー

OpenAI の API を使用して音声文字変換機能を提供する MCP サーバー。

インストール

設定

  1. リポジトリをクローンします。
git clone https://github.com/Ichigo3766/audio-transcriber-mcp.git cd audio-transcriber-mcp
  1. 依存関係をインストールします:
npm install
  1. サーバーを構築します。
npm run build
  1. 環境変数に OpenAI API キーを設定します。
  2. サーバー構成を環境に追加します。
{ "mcpServers": { "audio-transcriber": { "command": "node", "args": [ "/path/to/audio-transcriber-mcp/build/index.js" ], "env": { "OPENAI_API_KEY": "", "OPENAI_BASE_URL": "", // Optional "OPENAI_MODEL": "" // Optional } } } }

/path/to/audio-transcriber-mcpを、リポジトリのクローンを作成した実際のパスに置き換えます。

特徴

ツール

  • transcribe_audio - OpenAI の API を使用して音声ファイルを書き起こす
    • 必須パラメータとしてファイルパスを受け取ります
    • オプションパラメータ:
      • save_to_file: 転写をファイルに保存するためのブール値
      • 言語: ISO-639-1 言語コード (例: "en"、"es")

ライセンス

このMCPサーバーはMITライセンスに基づいてライセンスされています。つまり、MITライセンスの条件に従って、ソフトウェアを自由に使用、改変、配布することができます。詳細については、プロジェクトリポジトリのLICENSEファイルをご覧ください。

Install Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

OpenAI の Speech-to-Text API を使用して音声ファイルの文字起こしを可能にし、複数の言語とファイル保存オプションをサポートする MCP サーバーです。

  1. インストール
    1. 設定
  2. 特徴
    1. ツール
  3. ライセンス

    Related MCP Servers

    • -
      security
      A
      license
      -
      quality
      Enables recording audio from a microphone and transcribing it using OpenAI's Whisper model. Works as both a standalone MCP server and a Goose AI agent extension.
      Last updated -
      4
      Python
      MIT License
    • -
      security
      A
      license
      -
      quality
      An MCP server that enables LLMs to generate spoken audio from text using OpenAI's Text-to-Speech API, supporting various voices, models, and audio formats.
      Last updated -
      4
      1
      JavaScript
      MIT License
    • A
      security
      A
      license
      A
      quality
      A Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.
      Last updated -
      1
      15
      4
      JavaScript
      The Unlicense
      • Apple
      • Linux
    • A
      security
      A
      license
      A
      quality
      An official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.
      Last updated -
      19
      700
      Python
      MIT License
      • Apple

    View all related MCP servers

    MCP directory API

    We provide all the information about MCP servers via our MCP API.

    curl -X GET 'https://glama.ai/api/mcp/v1/servers/Ichigo3766/audio-transcriber-mcp'

    If you have feedback or need assistance with the MCP directory API, please join our Discord server