Skip to main content
Glama

VOICEVOX MCP Server

voicevox-mcp

このプロジェクトは、VOICEVOXエンジンと連携して音声合成やスピーカー情報の取得ができるMCP(Model Context Protocol)サーバーです。TypeScriptで実装されており、MCP SDKを利用しています。

機能

  • VOICEVOXエンジンのスピーカー情報取得(/speakers)
  • 指定したスピーカーでテキストを音声合成し、ローカルで再生(/speak)
    • Macのみ対応

セットアップ

VOICEVOXエンジンの起動(Docker推奨)

docker compose up -d

これで localhost:50021 でVOICEVOXエンジンが起動します。

依存パッケージのインストール & ビルド

npm install npm run build

使い方

Cursorの設定例

{ "mcpServers": { "voicevox-mcp": { "command": "node", "args": ["${Path to Repository}/dist/index.js"], "env": { "SPEAKER_ID": 8, "SPEED_SCALE": 1.2, "VOICEVOX_API_URL": "http://localhost:50021" } } } }

VOICEVOX_API_URLは必要に応じて設定

  • MCPクライアントから speakers ツールでスピーカー一覧を取得できます。
  • speak ツールでテキストを音声合成し、ローカルで再生できます(afplayコマンドを使用しているため、Mac環境推奨)。

主な依存パッケージ

  • @modelcontextprotocol/sdk
  • zod
  • typescript

注意事項

  • 今後改善
    • VOICEVOXエンジンが localhost:50021 で動作していないと音声合成は利用できません。
    • Mac以外の環境では afplay の部分を適宜変更してください。

ライセンス

MIT License

Deploy Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

local-only server

The server can only run on the client's local machine because it depends on local resources.

模型上下文协议服务器与 VOICEVOX 引擎集成,提供文本到语音合成和说话人信息检索,允许用户从文本生成和播放语音音频。

  1. 功能
    1. 设置
      1. 启动 VOICEVOX 引擎(推荐使用 Docker)
      2. 安装并构建依赖项
    2. 如何使用
      1. 光标设置示例
    3. 防范措施
      1. 执照

        Related MCP Servers

        • -
          security
          F
          license
          -
          quality
          Provides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.
          Last updated -
          7
        • -
          security
          A
          license
          -
          quality
          A Model Context Protocol server that integrates high-quality text-to-speech capabilities with Claude Desktop and other MCP-compatible clients, supporting multiple voice options and audio formats.
          Last updated -
          6
          1
          MIT License
        • -
          security
          F
          license
          -
          quality
          Enables seamless integration with Typecast API through the Model Context Protocol, allowing clients to manage voices, convert text to speech, and play audio in a standardized way.
          Last updated -
          2
        • -
          security
          A
          license
          -
          quality
          Official Model Context Protocol server that enables interaction with powerful Speech-to-Text and Audio Intelligence APIs, allowing clients like Claude Desktop to transcribe audio, analyze speech, translate content, and more.
          Last updated -
          2
          MIT License

        View all related MCP servers

        MCP directory API

        We provide all the information about MCP servers via our MCP API.

        curl -X GET 'https://glama.ai/api/mcp/v1/servers/Yuki10Kobayashi/voicevox-mcp'

        If you have feedback or need assistance with the MCP directory API, please join our Discord server