Skip to main content
Glama

VOICEVOX MCP Server

voicevox-mcp

このプロジェクトは、VOICEVOXエンジンと連携して音声合成やスピーカー情報の取得ができるMCP(Model Context Protocol)サーバーです。TypeScriptで実装されており、MCP SDKを利用しています。

機能

  • VOICEVOXエンジンのスピーカー情報取得(/speakers)
  • 指定したスピーカーでテキストを音声合成し、ローカルで再生(/speak)
    • Macのみ対応

セットアップ

VOICEVOXエンジンの起動(Docker推奨)

docker compose up -d

これで localhost:50021 でVOICEVOXエンジンが起動します。

依存パッケージのインストール & ビルド

npm install npm run build

使い方

Cursorの設定例

{ "mcpServers": { "voicevox-mcp": { "command": "node", "args": ["${Path to Repository}/dist/index.js"], "env": { "SPEAKER_ID": 8, "SPEED_SCALE": 1.2, "VOICEVOX_API_URL": "http://localhost:50021" } } } }

VOICEVOX_API_URLは必要に応じて設定

  • MCPクライアントから speakers ツールでスピーカー一覧を取得できます。
  • speak ツールでテキストを音声合成し、ローカルで再生できます(afplayコマンドを使用しているため、Mac環境推奨)。

主な依存パッケージ

  • @modelcontextprotocol/sdk
  • zod
  • typescript

注意事項

  • 今後改善
    • VOICEVOXエンジンが localhost:50021 で動作していないと音声合成は利用できません。
    • Mac以外の環境では afplay の部分を適宜変更してください。

ライセンス

MIT License

Deploy Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

local-only server

The server can only run on the client's local machine because it depends on local resources.

Un servidor de protocolo de contexto modelo que se integra con el motor VOICEVOX para proporcionar síntesis de texto a voz y recuperación de información del hablante, lo que permite a los usuarios generar y reproducir audio de voz a partir de texto.

  1. función
    1. configuración
      1. Iniciando el motor VOICEVOX (se recomienda Docker)
      2. Instalar y crear dependencias
    2. Cómo utilizar
      1. Ejemplo de configuración del cursor
    3. Precauciones
      1. licencia

        Related MCP Servers

        • -
          security
          F
          license
          -
          quality
          Provides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.
          Last updated -
          7
        • -
          security
          A
          license
          -
          quality
          A Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.
          Last updated -
          10
          1
          MIT License
        • -
          security
          F
          license
          -
          quality
          Enables seamless integration with Typecast API through the Model Context Protocol, allowing clients to manage voices, convert text to speech, and play audio in a standardized way.
          Last updated -
          2
        • -
          security
          A
          license
          -
          quality
          Official Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.
          Last updated -
          2
          MIT License

        View all related MCP servers

        MCP directory API

        We provide all the information about MCP servers via our MCP API.

        curl -X GET 'https://glama.ai/api/mcp/v1/servers/Yuki10Kobayashi/voicevox-mcp'

        If you have feedback or need assistance with the MCP directory API, please join our Discord server