Skip to main content
Glama

Audio Transcriber MCP Server

by Ichigo3766

OpenAI 음성-텍스트 변환 MCP 서버

OpenAI의 API를 사용하여 오디오 전사 기능을 제공하는 MCP 서버입니다.

설치

설정

  1. 저장소를 복제합니다.

지엑스피1

  1. 종속성 설치:
npm install
  1. 서버를 빌드하세요:
npm run build
  1. 환경 변수에 OpenAI API 키를 설정합니다.
  2. 환경에 서버 구성을 추가합니다.
{ "mcpServers": { "audio-transcriber": { "command": "node", "args": [ "/path/to/audio-transcriber-mcp/build/index.js" ], "env": { "OPENAI_API_KEY": "", "OPENAI_BASE_URL": "", // Optional "OPENAI_MODEL": "" // Optional } } } }

/path/to/audio-transcriber-mcp 저장소를 복제한 실제 경로로 바꾸세요.

특징

도구

  • transcribe_audio - OpenAI의 API를 사용하여 오디오 파일을 변환합니다.
    • 파일 경로를 필수 매개변수로 사용합니다.
    • 선택 매개변수:
      • save_to_file: 파일에 전사본을 저장할지 여부를 지정하는 부울 값입니다.
      • 언어: ISO-639-1 언어 코드(예: "en", "es")

특허

이 MCP 서버는 MIT 라이선스에 따라 라이선스가 부여됩니다. 즉, MIT 라이선스의 조건에 따라 소프트웨어를 자유롭게 사용, 수정 및 배포할 수 있습니다. 자세한 내용은 프로젝트 저장소의 LICENSE 파일을 참조하세요.

Install Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

여러 언어와 파일 저장 옵션을 지원하는 OpenAI의 음성-텍스트 API를 사용하여 오디오 파일을 변환하는 MCP 서버입니다.

  1. 설치
    1. 설정
  2. 특징
    1. 도구
  3. 특허

    Related MCP Servers

    • -
      security
      A
      license
      -
      quality
      Enables recording audio from a microphone and transcribing it using OpenAI's Whisper model. Works as both a standalone MCP server and a Goose AI agent extension.
      Last updated -
      4
      Python
      MIT License
    • -
      security
      A
      license
      -
      quality
      An MCP server that enables LLMs to generate spoken audio from text using OpenAI's Text-to-Speech API, supporting various voices, models, and audio formats.
      Last updated -
      4
      1
      JavaScript
      MIT License
    • A
      security
      A
      license
      A
      quality
      A Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.
      Last updated -
      1
      15
      4
      JavaScript
      The Unlicense
      • Apple
      • Linux
    • A
      security
      A
      license
      A
      quality
      An official Model Context Protocol (MCP) server that enables AI clients to interact with ElevenLabs' Text to Speech and audio processing APIs, allowing for speech generation, voice cloning, audio transcription, and other audio-related tasks.
      Last updated -
      19
      700
      Python
      MIT License
      • Apple

    View all related MCP servers

    MCP directory API

    We provide all the information about MCP servers via our MCP API.

    curl -X GET 'https://glama.ai/api/mcp/v1/servers/Ichigo3766/audio-transcriber-mcp'

    If you have feedback or need assistance with the MCP directory API, please join our Discord server